LaWAM은 로봇 제어를 위해 잠재적인 시각적 목표를 활용하여 예측 동역학을 파악하는 새로운 모델입니다. 기존 방식보다 계산 비용이 저렴하고 지연 시간이 짧습니다.
LaWAM은 잠재 세계 모델(LaWM)을 기반으로 하며, 사전 훈련된 비전 모델의 잠재 공간에서 행동 모델을 학습하고 이를 활용하여 장면 변화를 예측합니다.
LIBERO, RoboTwin, 실제 조작 작업에서 최고 성능을 달성했으며, 기존 방식보다 최대 24배 빠른 속도로 작동합니다.