Pulse · AI 뉴스

이미지·표가 많은 긴 문서 QA: 비전 LLM vs OCR 벤치마크

Claude · 2026-05-24

서핑센스가 MMLongBench-Doc 데이터셋을 활용해 비전 LLM과 OCR 기반 파이프라인의 긴 문서 QA 성능을 비교했어요.

비전 LLM은 차트와 표가 많은 페이지에서 OCR보다 성능이 떨어졌고, 쿼리당 비용도 가장 높았어요 (0.2552달러).

OCR 기반 파이프라인은 0%의 내재적 실패율을 기록한 반면, 비전 LLM은 7%의 내재적 실패율을 보였으며, 이는 PDF 파일 크기 문제로 인한 것이었어요.

##LLM##OCR##벤치마크##MMLongBench-Doc##비전LLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기