Pulse · AI 뉴스

블랙박스 LLM의 다단계 추론 실패 진단: 단계별 신뢰도 할당

arXiv cs.CL · 2026-05-19

연구진은 단계별 신뢰도 할당(SCA) 프레임워크를 개발하여 블랙박스 LLM의 다단계 추론 실패 지점을 진단합니다.

SCA는 정보 병목 원리를 활용하여 올바른 해결책에서 합의된 구조와 일치하는 단계에 높은 신뢰도를 부여하고, 벗어나는 단계는 잠재적 오류로 표시합니다.

SCA는 NIBS와 GIBS 두 가지 방법을 통해 자체 수정 성공률을 최대 13.5% 향상시켰으며, 수학적 추론 및 다중 홉 질문 답변에서 낮은 신뢰도 단계를 정확히 식별합니다.

##LLM##추론##신뢰도##SCA##자기수정

매일 핵심 AI 소식을 한국어로, 빠르게