사용자가 직접 개발한 오픈 소스 에이전트가 제미니-3-플래시-프리뷰를 기반으로 터미널벤치에서 최고 점수를 기록했어요. 자작 에이전트는 65.2%의 점수를 획득하여 구글 공식 모델과 기존 최고 성능의 클로즈드 소스 모델을 능가했어요. 터미널벤치 2.0의 부정행위 가능성을 인지하고, 에이전트 개발 과정에서 부정행위 요소를 사용하지 않았음을 밝혔어요.