연구진은 RAVEN(Real-time Autoregressive Video Extrapolation Network)이라는 새로운 프레임워크를 소개했어요. RAVEN은 훈련 시 테스트를 통해 과거 데이터와 노이즈를 결합하여 미래 예측에 필요한 과거 표현을 개선합니다.
일관성 모델 그룹 상대 정책 최적화(CM-GRPO)를 통해 기존의 복잡한 과정을 단순화하고 온라인 강화 학습을 적용하여 성능을 향상시켰어요.
실험 결과, RAVEN은 기존의 자가 예측 비디오 모델보다 품질, 의미, 동적 변화 측면에서 뛰어난 성능을 보였어요.