연구진은 숨겨진 상태 기반 추론적 디코딩에서 발생하는 장거리 성능 저하 문제를 분석했어요. KV 캐시 재사용을 통해 장거리 추론 정확도를 개선하는 KVShot 프레임워크를 제안하고, Qwen3-8B 모델로 실험했어요. 현재 훈련 파이프라인에서는 속도 향상이 미미하지만, KV-인식 디코딩의 잠재력을 최대한 활용하려면 블록 단위 훈련이 필요하다는 점을 밝혔어요.