연구진은 이미지-비디오 확산 모델이 물리 법칙을 위반하는 운동을 생성하는 경향이 있다는 사실을 밝혀냈어요. 2단계 생성 방식이 50단계 생성 방식보다 더 나은 물리적 일관성을 보인다는 놀라운 사실을 발견했어요. 이는 노이즈 제거 과정에서 위상 손실이 주요 원인이며, 위상 손실은 2단계에서 50단계로 진행될수록 약 18% 감소하는 것으로 나타났어요.