연구진은 LLM과 진화적 탐색을 결합하여 코드를 반복적으로 생성, 수정, 선택하는 시스템을 개발했어요. 이 시스템은 수학적 발견과 알고리즘 설계에서 뛰어난 성과를 거두었지만, 실제로는 무엇을 진화시키는지에 대한 근본적인 질문이 남아있어요. EvoTrace 데이터셋과 EvoReplay 방법론을 통해 진화 과정 자체를 분석하여, 기존 방식의 벤치마크 점수만으로는 알 수 없는 다양한 메커니즘을 밝혀냈어요.