연구진은 기존 VLA 모델의 한계를 극복하기 위해 잠재적 추론과 액션 실행을 통합하는 LaST-R1 프레임워크를 개발했어요. LaST-R1는 LAPO라는 새로운 RL 알고리즘을 통해 잠재적 추론 과정과 액션 생성 과정을 동시에 최적화하여 물리적 세계 모델링 능력을 향상시켰어요. 실험 결과, LaST-R1는 LIBERO 벤치마크에서 99.8%의 높은 성공률을 달성했으며, 실제 환경에서도 초기 정책 대비 44%의 성능 향상을 보였어요.