ABot-OCR은 페이지 이미지에서 바로 깨끗한 Markdown을 추출하는 새로운 비전-언어 모델입니다. 기존 방식의 복잡한 모듈 오케스트레이션 없이 단일 패스만으로 작동합니다.
구조적으로 일관된 데이터 엔진을 개발하여 파싱 정확도를 높였으며, Decoupled Heterogeneous Document Optimization 기술로 텍스트 정확도를 향상시켰습니다.
OmniDocBench 벤치마크에서 기존 시스템 대비 최고 성능을 기록하며, 다국어 텍스트 인식에서도 뛰어난 성능을 보였습니다.