연구진이 LeWorldModel(LeWM)의 계획 속도 문제를 해결하기 위해 Fast LeWorldModel(Fast-LeWM)을 제안했어요.
Fast-LeWM은 반복적인 로컬 롤아웃 대신 액션 프리픽스 예측을 활용해 액션 효과를 직접 모델링하고, 여러 호라이즌에 걸친 상태 변화를 학습해요.
실험 결과, Fast-LeWM은 LeWM 대비 계획 성공률을 높이고 계획 시간을 단축하며, 롤아웃 호라이즌 증가에 따른 잠재 손실 증가폭을 줄이는 데 성공했어요.