Pulse · AI 뉴스

활성 학습 기반 테이블 감지 파이프라인: 커버리지와 불확실성 균형

Active Learning · 2026-07-01

본 연구는 테이블 감지(TD)와 테이블 구조 인식(TSR) 파이프라인에 대한 새로운 활성 학습(AL) 전략을 제시합니다. 기존 AL 방식은 단일 모델에 맞춰져 있어 파이프라인 간 의존성을 고려하지 못합니다. UHerding을 기반으로 RankFusion과 CAPA를 제안하여 TD-TSR 의존성을 활용하고 성능을 향상시켰습니다.

PubTables-1M, FinTabNet 등 공개 데이터셋과 자체 데이터셋에서 다양한 예산으로 실험한 결과, UHerding이 기존 방식보다 우수한 성능을 보였습니다. RankFusion은 더 높은 성능 향상을 제공하지만 변동성이 크고, CAPA는 일관성 있는 성능을 보여주었습니다.

본 연구는 테이블 추출 파이프라인의 효율적인 학습을 위한 새로운 AL 전략을 제시하며, 데이터 주석 비용을 절감하고 모델 성능을 향상시키는 데 기여할 것으로 기대됩니다.

##활성학습##테이블감지##데이터주석##파이프라인
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기