Ryoiki-Tokuiten 사용자가 Qwen-3.6-27B와 Gemma-4-31B의 테스트 시간 컴퓨팅을 확장하여 Claude Mythos의 코드 최적화 및 속도를 능가하는 결과를 발표했어요.
새로운 스카폴드는 기존 모델 대비 약 25~40배 더 많은 컴퓨팅 자원을 사용하며, 다양한 알고리즘 설계 및 개선을 위한 브랜치 탐색, 반복 수정 루프, 가설 검증 등을 수행해요.
LLM의 장기 컨텍스트 추론 불안정성으로 인해 반복 4~5회 이후 성능 저하가 발생하지만, 브랜치 이력 기반 판단 및 최적 후보 선택을 통해 극복하고 개선된 결과를 도출했어요.
솔루션 풀은 반복 수정 루프에 구조적 노이즈를 추가하여 LLM이 지역 최소점에 갇히는 것을 방지하며, 파이썬 환경 접근을 통해 프로그램 검증 및 아이디어 개선을 지원해요.