연구진이 비디오 생성 모델의 속도 저하 문제를 해결하기 위해 RhymeFlow 프레임워크를 개발했어요. RhymeFlow는 핵심 프레임(keyframes)은 정밀하게 처리하고 나머지 프레임(non-keyframes)은 디노이징 단계를 건너뛰는 방식으로 작동해요.
핵심 프레임의 디노이징 과정에서 발생하는 시간적 불일치 문제를 해결하기 위해, 잠재 트래커토리 투영 모듈을 도입하여 시각적 품질을 개선했어요.
기존 방식 대비 RhymeFlow는 더 빠른 추론 속도와 향상된 시각적 품질을 제공하며, 현재 DiT 기반 비디오 생성 모델에서 효과를 입증했어요.