Pulse · AI 뉴스

Verifiable 환경은 레고 블록: 추론 일반화의 재귀적 조합

DeepSeek · 2026-06-11

연구진은 LLM의 추론 능력을 향상시키는 verifiable 환경을 재귀적으로 조합하는 RACES 프레임워크를 발표했어요.

RACES는 환경의 입력과 출력이 일치하면 자동으로 융합하여 새로운 verifiable 환경을 생성하는 composition 연산자를 정의해요.

RACES는 DeepSeek-R1-Distill-Qwen-14B 모델의 벤치마크 점수를 평균 3.1점 향상시키고, Qwen3-14B 모델의 성능을 58.8에서 61.1로 끌어올렸어요.

##LLM##RL##VerifiableEnvironme##RACES

매일 핵심 AI 소식을 한국어로, 빠르게