Pulse · AI 뉴스

복잡 문서 레이아웃의 읽기 순서 추론

OmniDocBench · 2026-07-01

연구진은 Glossa Ordinaria 레이아웃처럼 여러 읽기 흐름이 섞인 역사적 문서 디지털화의 핵심 과제인 읽기 순서 추론을 위한 새로운 프레임워크를 제시했어요.

이 프레임워크는 훈련 없이 그래프 기반으로 작동하며, OCR 텍스트 줄을 노드로 연결하고 언어 모델 신호를 활용해 읽기 순서를 파악해요.

합성 데이터, ALTO 페이지, OmniDocBench 데이터셋에서 기존 방식보다 높은 정확도를 보였으며, 특히 Glossa 레이아웃에서 95%의 정확도를 기록했어요.

수평/수직 페이지 반전 시에도 안정적인 성능을 유지하며, 기존 방식보다 훨씬 적은 성능 저하를 보여줬어요.

##문서분석##OCR##읽기순서##인공지능##딥러닝
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기