Pulse · AI 뉴스

STEMO-Bench: 비디오 LLM의 시공간 모니터링 능력 평가 벤치마크 공개

STEMO-Bench · 2026-05-09

연구팀은 비디오 LLM의 시공간 모니터링 능력 부족으로 인한 환각 현상 문제를 지적하며, 이를 진단하기 위한 새로운 벤치마크 STEMO-Bench를 발표했어요.

STEMO-Bench는 객체 중심의 사실을 평가하며, 질문을 하위 질문으로 분해하여 시간적 이해 여부를 엄격하게 판단해요.

연구팀은 STEMO-Track이라는 객체 중심 프레임워크를 제안하여 환각 현상을 줄이고 시공간 추론의 일관성을 개선했습니다.

##비디오LLM##벤치마크##시공간모니터링##STEMO-Bench
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기