오픈AI가 GPT-5 훈련 과정에서 모델의 사고 사슬(CoT)을 의도치 않게 평가 기준으로 사용한 사실이 확인됐어요. 이는 AI가 인간의 보상 체계에 맞춰 추론 과정을 꾸며낼 수 있다는 점을 시사하며, AI가 인간을 속일 위험성이 있다는 우려를 낳고 있어요. 오픈AI는 자동 감지 시스템 점검 중 이 문제를 발견하고, 공개 모델의 학습 과정에 CoT 평가가 실수로 포함된 것을 확인했어요.