키미 AI는 차세대 모델의 효율적인 활용을 위한 'Pre-fill-as-a-Service'를 공개했습니다. 이 서비스는 KVCache 기술을 활용하여 모델의 사전 학습 데이터를 저장하고 관리하며, 데이터센터 간 공유를 지원합니다. 이를 통해 모델 추론 속도를 향상시키고, 비용을 절감하며, 다양한 환경에서 모델을 사용할 수 있도록 돕습니다.