연구진이 비디오 LLM의 동작 환각 현상을 진단하기 위한 벤치마크인 MoHallBench를 발표했어요.
MoHallBench는 발생 가능성, 순차적 추론, 유사성 혼동 등 주요 환각 원인을 체계적으로 평가하며, 1만 1천306개의 비디오 클립과 4만 4천93개의 질문-답변 쌍으로 구성돼요.
실험 결과, 동작 인식과 환각 저항성은 분리되며, 순차적 추론 환각이 가장 심각한 문제로 나타났고, 강력한 사전 정보와 세분화된 유사성이 환각을 증폭시키는 것으로 확인됐어요.