연구진은 LLM의 추론 비용을 줄이기 위해 잠재 공간 탐색과 명시적 CoT 검증을 결합한 LaTER(Latent-Then-Explicit Reasoning)라는 새로운 패러다임을 제안했습니다.
LaTER는 Qwen3-14B 모델에서 벤치마크별로 토큰 사용량을 16~32% 줄이면서 정확도를 유지하거나 향상시켰으며, AIME 2025 문제를 73.3%의 정확도로 해결했습니다.
잠재 공간 롤아웃과 중단 감독을 활용한 LaTER 모델은 표준 CoT 기준선보다 10.0점 높은 80.0%의 정확도를 달성하며 토큰 사용량을 33% 줄였습니다.