본 연구는 테이블 감지(TD)와 테이블 구조 인식(TSR) 파이프라인에 대한 새로운 활성 학습(AL) 전략을 제시합니다. 기존 AL 방식은 단일 모델에 맞춰져 있어 파이프라인 간 의존성을 고려하지 못합니다. UHerding을 기반으로 RankFusion과 CAPA를 제안하여 TD-TSR 의존성을 활용하고 성능을 향상시켰습니다.
PubTables-1M, FinTabNet 등 공개 데이터셋과 자체 데이터셋에서 다양한 예산으로 실험한 결과, UHerding이 기존 방식보다 우수한 성능을 보였습니다. RankFusion은 더 높은 성능 향상을 제공하지만 변동성이 크고, CAPA는 일관성 있는 성능을 보여주었습니다.
본 연구는 테이블 추출 파이프라인의 효율적인 학습을 위한 새로운 AL 전략을 제시하며, 데이터 주석 비용을 절감하고 모델 성능을 향상시키는 데 기여할 것으로 기대됩니다.