Pulse · AI 뉴스

RAW-Dream: 작업 의존성 없는 세계 모델을 활용한 VLA 강화

RAW-Dream · 2026-05-13

연구진은 강화 학습을 통해 시각-언어-행동(VLA) 모델을 학습시키는 새로운 방법인 RAW-Dream(Reinforcing VLAs in task-Agnostic World Dreams)을 제안했습니다.

RAW-Dream은 작업 의존성을 완전히 분리하여 세계 모델 학습을 가능하게 하며, 사전 훈련된 세계 모델과 기존 VLM을 활용하여 새로운 작업에 대한 VLA 적응을 지원합니다.

실험 결과, 일반화된 물리적 사전 지식이 작업 의존적인 데이터를 대체하여 VLA 적응에 효과적이며, 시뮬레이션 및 실제 환경에서 성능 향상을 보였습니다.

##VLA##세계모델##강화학습##RAW-Dream##제로샷

매일 핵심 AI 소식을 한국어로, 빠르게