연구진은 불필요하게 긴 Chain-of-Thoughts(CoT)를 줄이기 위해 '최소 충분 CoT(MSC)' 개념을 제시했어요. MSC는 정답을 도출하는 데 필요한 최소한의 CoT 경로를 의미하며, 이를 통해 추론 토큰을 줄이고 정확도를 향상시킬 수 있어요.
MSC를 기반으로 'SuCo'라는 2단계 훈련 프레임워크를 제안했는데, 1단계는 문제 난이도에 따라 충분성 임계값을 조정하여 MSC 데이터를 생성하고 모델을 미세 조정하는 방식이에요.
수학, 코딩, 과학 벤치마크 실험 결과, SuCo는 정확도와 추론 효율성 모두에서 일관된 성능 향상을 보여줬어요.