소규모 언어 모델(SLM)은 배포 효율성이 뛰어나지만, 추론 능력은 대규모 언어 모델(LLM)에 비해 부족한 경우가 많아요. 연구진은 LLM의 역할을 자유로운 토큰 생성에서 SLM의 제안 후보 중 선택으로 재정의하는 SELECT TO THINK (S2T)를 제안했어요. S2T-LOCAL은 SLM에 선택 로직을 증류하여 LLM 의존성 없이 자율적인 재순위를 수행할 수 있도록 지원하며, 성능을 향상시켰어요.