Pulse · AI 뉴스

LaST-R1: 적응형 물리적 잠재적 추론을 통한 액션 강화 VLA 모델

LaST-R1 · 2026-05-01

연구진은 기존 VLA 모델의 한계를 극복하기 위해 잠재적 추론과 액션 실행을 통합하는 LaST-R1 프레임워크를 개발했어요.

LaST-R1는 LAPO라는 새로운 RL 알고리즘을 통해 잠재적 추론 과정과 액션 생성 과정을 동시에 최적화하여 물리적 세계 모델링 능력을 향상시켰어요.

실험 결과, LaST-R1는 LIBERO 벤치마크에서 99.8%의 높은 성공률을 달성했으며, 실제 환경에서도 초기 정책 대비 44%의 성능 향상을 보였어요.

##VLA##로봇##강화학습##추론##LaST-R1

매일 핵심 AI 소식을 한국어로, 빠르게