Pulse · AI 뉴스

사고 과정 추적, 과연 신뢰할 수 있을까: 체인-오브-소트(CoT)의 불완전한 감시 채널 가능성

Qwen · 2026-05-12

연구진은 체인-오브-소트(CoT) 추적이 언어 모델의 능력 향상과 행동 감사에 사용되지만, 보이는 추적이 실제 계산과 동기화되지 않을 수 있다는 점을 테스트했습니다.

9개 모델과 7개의 추론 벤치마크에서 평균적으로 61.9%의 단계에서만 정답에 대한 약속과 명시적 답변 도착이 일치하는 것으로 나타났습니다.

연구 결과, CoT는 유용할 수 있지만, 답변이 형성된 시점을 신뢰할 수 없는 보고 채널일 수 있으며, 정답이 결정된 후에도 계속해서 생각하는 듯한 텍스트를 생성할 수 있다는 점을 시사합니다.

##CoT##체인오브소트##언어모델##추론##감사

매일 핵심 AI 소식을 한국어로, 빠르게