연구진이 시퀀스 모델 기반 장편 비디오 생성 기술 FlowLong을 제안했어요. 이 기술은 기존 방식의 품질 저하 및 반복적인 움직임 문제를 해결해요. FlowLong은 다양한 비디오 생성 모델에 적용 가능하며, 기존 방식보다 뛰어난 성능을 보여줘요.
FlowLong은 슬라이딩 윈도우 방식으로 장편 비디오를 생성하며, Tweedie 매칭을 통해 일관성을 유지해요. 초기 단계에서는 무작위 샘플링을 사용하고, 후반 단계에서는 ODE 샘플링을 적용하여 시각적 품질을 높여요.
연구 결과, FlowLong은 원본 윈도우 길이보다 훨씬 긴 비디오를 생성하며, 오디오-비디오 통합 생성 및 텍스트-3DGS 생성에도 활용 가능했어요.