Pulse · AI 뉴스

EgoCoT-Bench: MLLM의 타당한 추론 능력 평가 벤치마크

EgoCoT-Bench · 2026-05-19

연구진은 MLLM의 1인칭 시점 동영상 이해 능력을 평가하는 EgoCoT-Bench를 공개했어요.

EgoCoT-Bench는 기존 벤치마크의 한계인 타당한 근거 평가 부족을 해결하고, 단계별 추론 과정을 명확히 합니다.

총 3,172개의 QA 쌍으로 구성된 EgoCoT-Bench는 시공간 장면 그래프 기반으로 구축되었으며, 12개의 하위 그룹을 포함합니다.

##MLLM##벤치마크##EgoCoT-Bench##추론
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기