KAIST CV랩이 이전 장면을 일관성 있게 재현하는 WorldKV 기술을 발표했어요. World Retrieval과 World Compression을 통해 월드 메모리 충실도를 유지하면서도 처리 속도를 향상시켰어요. Matrix-Game-2.0와 LingBot-World-Fast에서 기존 방식 대비 2배 빠른 속도로 유사한 성능을 보였어요.
World Retrieval은 GPU/CPU 메모리에 저장된 KV-cache를 재활용하고, World Compression은 불필요한 토큰을 제거하여 저장 공간을 절약해요. 이를 통해 월드 메모리 충실도를 유지하면서도 처리 속도를 높일 수 있었어요.
WorldKV는 별도 파인튜닝 없이도 기존 메모리 기반 방식과 경쟁력 있는 성능을 보여주며, 프로젝트 페이지에서 관련 정보 확인 가능해요.