서핑센스가 MMLongBench-Doc 데이터셋을 활용해 비전 LLM과 OCR 기반 파이프라인의 긴 문서 QA 성능을 비교했어요. 비전 LLM은 차트와 표가 많은 페이지에서 OCR보다 성능이 떨어졌고, 쿼리당 비용도 가장 높았어요 (0.2552달러). OCR 기반 파이프라인은 0%의 내재적 실패율을 기록한 반면, 비전 LLM은 7%의 내재적 실패율을 보였으며, 이는 PDF 파일 크기 문제로 인한 것이었어요.