Conformal Thinking은 LLM의 추론 예산을 설정하는 문제를 위험 통제로 재구성하는 프레임워크입니다. 오류율을 제한하면서 컴퓨팅 비용을 최소화하는 것을 목표로 합니다. 연구진은 LLM의 추론 예산과 신뢰도 향상을 위한 임계값을 설정하는 데 드는 위험-정확도 균형 문제를 해결합니다. 새로운 상한 임계값을 도입하여 추가 컴퓨팅이 도움이 되지 않을 때 조기에 추론을 중단하여 컴퓨팅 비용을 절감합니다.