Pulse · AI 뉴스

언제 멈출지 알아야: 세그먼트 레벨 크레딧 할당을 통한 과도한 사고 감소

DASH · 2026-07-01

연구진은 언어 모델이 불필요한 회피, 포기, 자기 모순 등의 행동을 반복하며 토큰을 낭비하는 '과도한 사고' 문제를 확인했어요. 과도한 사고는 답변 길이의 문제가 아니라, 잘못된 추론 과정에서 발생하는 경향이 있으며, 정확한 추론 과정보다 더 높은 비율로 나타나요. DASH(Drift Aware advantage SHaping)라는 새로운 방법을 통해 수학 벤치마크에서 정확도를 높이고 과도한 사고를 줄이는 데 성공했어요.

##언어모델##추론##DASH##과도한사고
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기