이 논문은 MetaAI를 성숙한 패러다임이 아닌, 인간이 시드하고 AI가 확장하는 개발 패턴으로 정의합니다. 재현 가능한 공학적 증거 프레임워크 4가지 기준을 제시하고, DGM, STOP, Goedel Agent, ShinkaEvolve 시스템을 분석했습니다. DGM은 SWE-bench Verified에서 20%에서 50%로, Polyglot에서 14.2%에서 30.7%로 개선되는 직접적인 증거를 제공합니다.
MetaAI 재귀적 자기 설계는 AI 시스템의 구축, 평가, 개선 방식을 AI가 수정하는 것을 의미합니다. 논문은 검사 가능한 대상 시스템, 메타 레벨 수정자, 피드백 기반 선택, 재귀적 연속이라는 4가지 기준을 통해 MetaAI를 평가합니다.
MetaAI-Mini라는 HumanEval 기반 프로토콜과 코드를 제공하며, 완전한 모델 실행이 포함되지 않아 실험 결과 대신 프로토콜로 보고됩니다.