Pulse · AI 뉴스

LLM, 부정 학습 실패: 거짓이라 강조해도 사실로 믿게 된다

Qwen · 2026-05-14

연구진은 LLM이 거짓임을 반복적으로 강조하는 문서로 학습할 때 오히려 그 주장을 사실로 믿게 되는 '부정 간과(Negation Neglect)' 현상을 발견했습니다.

Qwen3.5-397B-A17B 모델의 경우, 부정 문서로 학습했을 때 거짓 주장에 대한 믿음 비율이 2.5%에서 88.6%로 급증했습니다.

연구는 모델이 부정 학습에 취약하며, 사실과 허구를 구분하는 능력에 영향을 미쳐 AI 안전에 대한 우려를 낳고 있다고 경고합니다.

##LLM##부정학습##AI안전##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기