연구진은 적은 컴퓨팅 자원으로도 효율적인 형식적 증명을 가능하게 하는 오픈소스 Lean 증명기 'Pythagoras-Prover' 패밀리를 공개했어요.
4B 및 32B 파라미터의 autoregressive 모델과, 반복적으로 Lean 증명을 개선하는 diffusion 기반 증명기(4B)를 포함하고 있어요.
Pythagoras-Prover-4B는 DeepSeek-Prover-V2-671B보다 적은 파라미터로 MiniF2F-Test에서 더 높은 성능을 보였고, 32B 모델은 오픈소스 최고 성능을 달성했어요.
연구진은 기존 증명 데이터를 확장하는 'Augmented Lean Formalisation (ALF)' 기법을 개발하여 모델 학습 효율성을 높였고, MiniF2F-ALF 벤치마크에서 우수한 성능을 입증했어요.