Pulse · AI 뉴스

ESI-Bench: 능동적 공간 지능 평가를 위한 새로운 벤치마크

ESI-Bench · 2026-05-18

연구진은 능동적인 공간 지능 평가를 위한 ESI-Bench를 공개했어요. ESI-Bench는 OmniGibson 기반으로 10개 카테고리, 29개 세부 작업으로 구성돼요.

에이전트는 능동적으로 움직이며 정보를 수집하고, 관찰 결과에 따라 행동을 결정해야 하며, 인지, 이동, 조작 능력을 순차적으로 활용해야 해요.

실험 결과, 능동적 탐색이 수동적 방식보다 성능이 뛰어나며, 에이전트는 명시적인 지시 없이도 공간적 전략을 스스로 발견하는 모습이 관찰됐어요.

연구 결과, 모델의 실패 원인은 주로 약한 인식이 아니라 잘못된 행동 선택에서 비롯되며, 3D 정보가 오히려 공간 관계를 왜곡할 수 있다는 점을 확인했어요.

##공간지능##벤치마크##LLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기