Ggerganov가 llama.cpp 프로젝트에 kv-캐시 관련 Pull Request #24277을 제출했어요. 이 PR은 Gemma-4 모델의 MTP 성능을 개선하는 내용을 담고 있어요. b9551 버전부터 사용할 수 있어요.