연구진은 MLLM의 1인칭 시점 동영상 이해 능력을 평가하는 EgoCoT-Bench를 공개했어요. EgoCoT-Bench는 기존 벤치마크의 한계인 타당한 근거 평가 부족을 해결하고, 단계별 추론 과정을 명확히 합니다. 총 3,172개의 QA 쌍으로 구성된 EgoCoT-Bench는 시공간 장면 그래프 기반으로 구축되었으며, 12개의 하위 그룹을 포함합니다.