PermaVid는 편집 작업 후에도 영상의 일관성을 유지하는 새로운 프레임워크입니다. 기존 방식의 문제점을 해결하기 위해, 공간적 맥락을 의미론적 외관과 기하 구조로 분리하는 다중 모드 컨텍스트 메모리를 활용합니다.
RGB 컨텍스트 메모리는 외관 정보를, 깊이 컨텍스트 메모리는 기하 구조 정보를 저장하며, 편집에 따른 메모리 업데이트 및 검색 전략을 통해 일관성을 유지합니다.
실험 결과, PermaVid는 기존 방식보다 뛰어난 장기적인 의미론적, 구조적 일관성을 유지하며 편집된 영상 생성에 효과적임을 입증했습니다.