연구팀이 일본 정부 백서에서 추출한 차트·표 기반 시각 질의응답(VQA) 벤치마크 'HakushoBench'를 공개했어요. 이 벤치마크는 2,053개의 이미지와 수동으로 작성된 질의응답 쌍으로 구성돼 있으며, 차트와 표의 심층적인 이해를 평가하는 데 중점을 둡니다. 오픈 웨이트 모델의 성능이 58.6%로, 독점 모델과의 격차가 34.9점에 달하며, 복잡한 차트·표 이해에 대한 개선 여지가 큽니다.