연구진은 현재 세계 모델 연구가 2D 비디오 생성, 3D 장면 중심, JEPA와 같은 잠재 모델로 나뉘어 물리적 신뢰성, 행동 제어, 장기 예측에 어려움을 겪고 있다고 지적했어요.
해밀턴 세계 모델을 제안하며, 관측 내용을 구조화된 잠재 위상 공간에 인코딩하고, 해밀턴-풍의 역학을 통해 잠재 상태를 진화시키고, 미래 관측으로 예측된 궤적을 디코딩하는 방식을 사용해요.
해밀턴 구조는 해석 가능성, 데이터 효율성, 장기적인 안정성을 향상시킬 수 있지만, 마찰, 접촉, 비보존력, 변형 가능한 물체와 같은 실제 로봇 장면의 어려움도 존재한다고 언급했어요.