연구진은 LLM의 테스트 시간 스케일링(TTS) 전략을 자동으로 발견하는 환경 기반 프레임워크인 AutoTTS를 제안했습니다.
AutoTTS는 폭이 넓어지거나 깊이가 깊어지는 TTS를 제어하는 컨트롤러 합성을 통해 미리 수집된 추론 경로와 신호를 활용하여 효율적인 탐색을 가능하게 합니다.
실험 결과, 발견된 TTS 전략은 수학적 추론 벤치마크에서 수동으로 설계된 강력한 기준보다 정확도-비용 균형을 개선했으며, 데이터와 코드는 오픈 소스로 공개될 예정입니다.