연구팀은 비디오 LLM의 시공간 모니터링 능력 부족으로 인한 환각 현상 문제를 지적하며, 이를 진단하기 위한 새로운 벤치마크 STEMO-Bench를 발표했어요. STEMO-Bench는 객체 중심의 사실을 평가하며, 질문을 하위 질문으로 분해하여 시간적 이해 여부를 엄격하게 판단해요. 연구팀은 STEMO-Track이라는 객체 중심 프레임워크를 제안하여 환각 현상을 줄이고 시공간 추론의 일관성을 개선했습니다.