연구진은 실제 문서 처리 환경에서의 LLM 성능을 평가하기 위해 CC-OCR V2라는 새로운 벤치마크를 공개했어요. CC-OCR V2는 텍스트 인식, 문서 파싱, 핵심 정보 추출 등 5가지 트랙으로 구성되며, 총 7,093개의 난이도 높은 샘플로 이루어져 있습니다. 14개의 최신 LLM을 테스트한 결과, 현재 모델들은 실제 환경 요구사항을 충족하지 못하며 성능 개선이 필요하다는 점을 확인했습니다.