연구진은 비디오 월드 모델(WM)의 현실적인 미래 예측을 활용하여 로봇 정책 평가 및 개선하는 StressDream을 제안했어요.
StressDream은 딥러닝 모델이 생성하는 비디오의 초기 노이즈를 최적화하여 정책 평가 시 발생할 수 있는 위험한 상황을 예측하고, 로봇 정책을 개선하는 데 활용돼요.
연구 결과, StressDream은 자율 주행 및 로봇 조작 분야에서 텍스트 기반으로 현실적이고 중요한 미래 상황을 예측하여 정책 평가 및 개선에 기여하는 것으로 나타났어요.