연구진이 장편 비디오 생성 시 오류 누적 문제를 해결하기 위해 검색 증강 생성(RAG) 프레임워크 LongLive-RAG을 제안했어요.
LongLive-RAG은 기존 슬라이딩 윈도우 방식의 한계를 극복하기 위해, 이전에 생성된 latent를 검색 가능한 역사로 활용하여 비선형적인 생성 경로를 가능하게 해요.
Window Temporal Delta Loss를 통해 시간적 변화를 강조하는 검색 성능을 개선했고, 다양한 AR 백본과 생성 길이에서 VBench-Long 순위 1위를 달성했어요.