Goedel-Architect는 Lean 4 기반 공식 증명 자동화를 위한 새로운 프레임워크로, 블루프린트 생성 및 개선에 집중합니다.
DeepSeek-V4-Flash (284B)를 기반으로 MiniF2F-test에서 99.2% pass@1, PutnamBench에서 75.6% pass@1 달성했습니다.
자연어 증명 가이드라인을 활용하여 MiniF2F-test 문제를 모두 해결하고, PutnamBench 성능을 향상시키는 등 뛰어난 성능을 보입니다.