연구진은 LLM 추론 과정의 효율성과 제어 가능성을 높이는 Agentic Chain-of-Thought Steering (ACTS)를 제안했어요. ACTS는 컨트롤러 에이전트가 추론 과정을 관찰하고 전략 및 스티어링 구문을 통해 다음 단계를 유도하는 마르코프 결정 프로세스 방식을 사용해요. 실험 결과, ACTS는 토큰 사용량을 줄이면서도 기존 추론 성능을 유지하고, 정확도와 효율성 간의 균형을 조절할 수 있음을 입증했어요.