연구진은 LLM이 생성한 형식 증명이 기존의 수학 라이브러리 증명보다 가독성, 모듈성, 유지보수성, 재사용성이 떨어지는 문제를 지적했어요.
Proof-Refactor는 증명 재구조 과정을 4단계로 나누는 에이전트 프레임워크로, 기존의 단일 지표 최적화 방식에서 벗어났어요.
PutnamBench와 Putnam2025에서 생성된 Lean 증명을 대상으로 실험한 결과, Proof-Refactor는 Claude Code를 능가하는 성능을 보였으며, 특히 서명 품질과 가독성 향상에 기여했어요.