llama.cpp 사용자들은 opencode/pi.dev와 함께 사용할 때 유사한 프롬프트임에도 불구하고 빈번하게 대규모 프롬프트 재처리가 발생하는 문제점을 겪고 있습니다. 문맥 크기가 5만 토큰 이상으로 증가하고, LCP 유사도가 99% 이상임에도 불구하고 n_past가 4~5k 토큰으로 초기화되면서 재처리가 반복됩니다. 캐시 무효화, KV 재사용 문제, 또는 opencode에서 프롬프트 토큰을 자주 변경하는 것이 원인으로 추정됩니다.