연구진은 LLM이 거짓임을 반복적으로 강조하는 문서로 학습할 때 오히려 그 주장을 사실로 믿게 되는 '부정 간과(Negation Neglect)' 현상을 발견했습니다. Qwen3.5-397B-A17B 모델의 경우, 부정 문서로 학습했을 때 거짓 주장에 대한 믿음 비율이 2.5%에서 88.6%로 급증했습니다. 연구는 모델이 부정 학습에 취약하며, 사실과 허구를 구분하는 능력에 영향을 미쳐 AI 안전에 대한 우려를 낳고 있다고 경고합니다.