MaxProof는 MiniMax-M3 시리즈의 경쟁 수준 수학 증명에 대한 군집 규모 테스트 시간 확장 프레임워크입니다. M3는 증명 생성, 증명 검증, 비판 기반 증명 수리 기능을 훈련하고, 낮은 오탐율을 위한 생성 검증기를 설계했습니다. MaxProof는 테스트 시간 동안 모델을 생성기, 검증기, 개선기, 순위기로 활용하여 후보 증명군을 검색하고 토너먼트 선택을 통해 최종 증명을 반환합니다.
MaxProof 테스트 시간 확장을 통해 M3 모델은 IMO 2025에서 35/42, USAMO 2026에서 36/42를 달성하여 양쪽 모두 인간 금메달 기준을 초과했습니다. 이 모델은 수학적 증명 분야에서 중요한 진전을 보여줍니다. 새로운 프레임워크는 복잡한 수학적 문제를 해결하는 데 있어 LLM의 잠재력을 입증합니다.