연구진은 LLM 추론 효율성을 높이는 새로운 방법 'Fork-Think with Confidence'를 제안했어요.
기존 병렬 추론 방식과 달리, 먼저 모델의 확신도를 기반으로 분기 지점을 파악한 뒤 추론을 시작하는 '먼저 결정 후 생각' 패러다임을 따릅니다.
실험 결과, Fork-Think는 토큰 소비를 최대 30% 줄이고 실행 시간을 최대 57% 단축하며 기존 방식과 유사하거나 더 나은 성능을 보였어요.
연구는 LLM 추론의 효율성을 높이는 '사전 결정 분기'가 유망한 연구 방향임을 입증했어요.