Pulse · AI 뉴스

InfoKV: 정보 기반 KV 캐시 압축을 통한 장문 추론 성능 향상

DeepSeek · 2026-06-25

연구진이 LLM의 장문 추론 성능을 높이는 InfoKV 프레임워크를 개발했어요. InfoKV는 예측 불확실성, 표현 변화를 반영해 기존 방식보다 뛰어난 성능을 냈어요. Llama-3.1, Llama-3.2, DeepSeek-R1 모델에서 장문 프리필링과 디코딩 시 모두 성능 향상을 확인했어요.

##LLM##KV캐시##압축##추론##InfoKV
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기