Niels Rogge가 Papers with Code에 OCR 벤치마크 결과 및 최고 성능 오픈 소스 모델 목록을 공개했어요.
Baidu는 R-SWA 기술을 적용한 3B 파라미터 모델 Unlimited OCR을 출시했고, Mistral은 OCR 4를 API로 제공해요.
OCR은 PDF·스캔 문서 디지털화 작업으로, AI 에이전트의 RAG (검색 증강 생성) 활용에 중요한 역할을 해요.
OlmOCRBench, OmniDocBench 벤치마크를 기반으로 Chandra OCR 2, Mistral OCR v4가 최고 성능으로 추천돼요.