최근 LLM의 테스트 시간 컴퓨팅 발전으로 답변 생성 전에 중간 단계의 체인 오브 소트(CoT) 추론을 수행할 수 있게 되었어요. 사고 예산을 늘리면 추론 시간 동안 성능이 향상되지만, LLM 능력, 쿼리 복잡성, 최적의 예산 할당 간의 관계는 아직 명확하지 않아요. 연구진은 사고의 필요성을 나타내는 지표로 자기 일관성(다중 추론 경로 간의 합의)을 활용하여 컴퓨팅 효율적인 추론을 달성하기 위한 방법을 모색했어요.