KAIST CV랩이 장기적인 일관성을 유지하면서도 실시간 성능을 내는 월드 메모리 기술 'WorldKV'를 발표했어요. World Retrieval과 World Compression 두 가지 핵심 기술을 통해 이전에 본 시점을 다시 방문해도 일관된 콘텐츠를 제공합니다. 기존 방식 대비 2배 빠른 처리 속도를 유지하면서도 메모리 효율성을 높였습니다.
World Retrieval은 이전에 삭제된 KV 캐시 조각을 GPU/CPU 메모리에 저장하고, 카메라/액션 일치도를 기반으로 관련 장면을 선택적으로 검색하여 재인코딩 없이 삽입합니다. World Compression은 앵커 프레임과의 키-키 유사성을 기반으로 각 조각 내의 중복 토큰을 제거하여 저장 공간을 절반으로 줄입니다.
Matrix-Game-2.0 및 LingBot- World-Fast 환경에서 WorldKV는 전체 KV 메모리 수준의 충실도를 유지하면서 처리 속도는 2배 향상되었으며, 파인튜닝 없이도 메모리 기반 모델과 경쟁력 있는 성능을 보입니다.