연구진은 기존 도구 연동 추론(TIR) 방식의 한계를 극복하기 위해 코드 자체로 추론하는 새로운 프레임워크인 ThinC를 제안했습니다.
ThinC는 자연어 계획 단계 이후 모든 추론을 코드 블록으로 진행하며, 12.2K개의 코드 중심 추론 경로를 활용해 ThinC-1.7B와 ThinC-4B 모델을 학습했습니다.
ThinC-4B는 5개의 수학 벤치마크에서 기존 TIR 모델을 능가하고, Qwen3-235B-A22B-Thinking보다도 뛰어난 성능을 보였습니다.