연구진은 코드 자동 완성에서 노후된 저장소 스니펫이 해로운 노이즈인지, 아니면 현재 상태와 호환되지 않는 코드를 유발하는지 진단하기 위해 연구를 진행했어요.
Qwen2.5-Coder-7B-Instruct 모델에서 88.2%, gpt-4.1-mini 모델에서 76.5%의 비율로 노후된 헬퍼 레퍼런스를 유발하는 것을 확인했어요.
연구 결과, 모델의 코드 RAG(Retrieval-Augmented Generation) 강건성을 진단할 때 시간적 유효성이 중요한 요소임을 보여줬어요.