연구진은 비디오 생성 모델이 생성한 영상이 실제 로봇 조작으로 이어질 수 있는지 평가하는 Dream.exe 프레임워크를 제안했어요.
Dream.exe는 영상과 작업 설명을 기반으로 조작 영상을 합성하고, 이를 로봇 경로로 변환해 물리 시뮬레이터에서 실행하며, 시각적 지표로는 측정할 수 없는 실행 가능성을 평가합니다.
8개의 모델을 평가한 결과, 일부 모델은 측정 가능한 실행 성공률을 보였지만, 시각적 품질이 실행 가능성을 잘 예측하지 못한다는 점이 확인됐어요.