연구진은 LLM 에이전트가 오래된 레포지토리를 현대 환경에 맞춰 호환성을 복구할 수 있는지 실증적으로 연구했어요.
RepoRescue 데이터셋은 과거에 작동했지만 현대화 과정에서 실패한 193개의 Python 및 122개의 Java 레포지토리로 구성돼요.
Kimi 에이전트는 테스트 파일 편집을 제한해도 41.5%의 레포지토리를 복구했으며, 시스템 간의 상호 보완성은 62.7%의 복구율을 달성했어요.
복구된 레포지토리의 테스트 스위트 통과는 초기 신호일 뿐이며, 34개 후보 중 22개는 실제 시나리오에서 작동하고 12개는 추가 패치를 통해 호환성 문제를 해결했어요.