연구진이 이미지·비디오 생성 모델의 추론 속도 저하 문제를 해결하기 위해 '속도 분해 및 추정(VDE)' 기법을 제안했어요. VDE는 기존 캐싱 방식에서 벗어나 모델 속도를 분해하고 추정하여 입력에 맞춰 정확하게 속도를 조절해요. 실험 결과, VDE는 기존 방식보다 최대 3.22배 빠른 속도를 낼 수 있었고, Qwen-Image에서 LPIPS 점수를 0.069로 낮춰 성능을 개선했어요.
VDE는 모델 속도를 입력에 따라 분해하고 추정하여 정확한 속도 조절을 가능하게 하며, 오류 누적을 방지하기 위해 주기적으로 모델 상태를 재정렬해요. 기존 방식의 단점을 보완하여 이미지와 비디오 생성 작업에서 상당한 속도 향상을 달성했어요.
VDE는 학습 과정 없이 구현 가능하며, Flux 모델을 3.22배 가속화하고 Qwen-Image에서 LPIPS 점수를 52.2% 감소시키는 등 뛰어난 성능을 입증했어요.