연구진은 로봇 행동 예측을 넘어 시각적 관찰까지 생성하는 World Action Models(WAM)을 활용해 지속적인 모방 학습 프레임워크인 Recurrent Generative Replay(REGEN)를 제안했어요.
REGEN은 WAM을 반복적으로 쿼리하여 과거 학습 작업을 재연하며, 실제 데모 데이터 저장 없이 로봇 정책이 연습할 수 있도록 지원해요.
시뮬레이션 및 실제 환경 실험 결과, REGEN은 기존 방식 대비 최대 50%의 재앙적 망각을 줄이고, 실제 리플레이 데이터 접근 방식에 버금가는 성능을 보였어요.