AI 에이전트들이 동일한 문서를 읽을 때마다 매번 KV 캐시를 재계산하는 비효율적인 행위를 반복하고 있습니다.
연구진은 문서의 KV 캐시를 미리 계산해 두고 다른 에이전트들이 이를 구매하여 재계산 비용을 절약할 수 있도록 제안합니다.
사전 계산된 KV 캐시를 사용하는 방식은 정확도가 손상되지 않으며, Qwen3-4B 모델에서 최대 50배의 계산 비용 절감 효과를 보입니다.
연구진은 KV 캐시 호스팅 및 결제 시스템 구축을 위한 추가 연구 과제를 남겨두고, 에이전트 친화적인 프리필 CDN을 제안합니다.