연구진은 목표 달성을 위해 로봇이 부분적인 관찰 환경에서 미래 시각 변화를 예측하고 목표에 가까워지는 행동을 해야 한다는 점에 주목했어요.
NavWAM은 항법 세계 모델 예측을 실행 가능한 행동으로 전환하는 diffusion-transformer 정책으로, 미래 관찰, 목표 진행 값, 행동 조각을 공유된 잠재 시퀀스로 표현해요.
시뮬레이션 사전 훈련과 실제 로봇 적응을 통해 개발된 NavWAM은 기존 항법 세계 모델 기반 방식보다 성능이 우수하며, 별도의 행동 탐색 없이도 기본 정책 모드로 작동해요.