EA-WM은 로봇 제어와 시각적 인지를 연결하는 새로운 월드 모델로, 로봇의 공간 기하학적 구조와 로봇-객체 상호작용 역학을 정확하게 생성하는 데 중점을 둡니다.
기존 방식과 달리, EA-WM은 로봇의 행동과 상태를 카메라 시점에 직접 투영하는 Structured Kinematic-to-Visual Action Fields를 사용합니다.
WorldArena 벤치마크에서 기존 모델보다 뛰어난 성능을 보이며, 월드 모델 분야의 새로운 가능성을 제시합니다.