연구진은 LLM의 추론 능력을 향상시키는 verifiable 환경을 재귀적으로 조합하는 RACES 프레임워크를 발표했어요.
RACES는 환경의 입력과 출력이 일치하면 자동으로 융합하여 새로운 verifiable 환경을 생성하는 composition 연산자를 정의해요.
RACES는 DeepSeek-R1-Distill-Qwen-14B 모델의 벤치마크 점수를 평균 3.1점 향상시키고, Qwen3-14B 모델의 성능을 58.8에서 61.1로 끌어올렸어요.