Pulse · AI 뉴스

HakushoBench: 일본 정부 백서 기반 차트·표 VQA 벤치마크

HakushoBench · 2026-05-31

연구팀이 일본 정부 백서에서 추출한 차트·표 기반 시각 질의응답(VQA) 벤치마크 'HakushoBench'를 공개했어요. 이 벤치마크는 2,053개의 이미지와 수동으로 작성된 질의응답 쌍으로 구성돼 있으며, 차트와 표의 심층적인 이해를 평가하는 데 중점을 둡니다. 오픈 웨이트 모델의 성능이 58.6%로, 독점 모델과의 격차가 34.9점에 달하며, 복잡한 차트·표 이해에 대한 개선 여지가 큽니다.

##벤치마크##일본##VQA##HakushoBench
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기