연구진은 LLM이 대화 없이 계획과 행동을 통해 다른 에이전트의 믿음 상태를 유도하는 능력을 평가하는 새로운 프레임워크 NCP-ToM을 제시했어요. GPT-5는 80%의 성공률로 인간 참가자를 능가하며, 인간보다 특정 목표 달성을 위한 믿음 상태 유도에 더 효과적이었어요. 연구 결과, LLM과 인간 모두가 진실한 믿음 상태를 유도하는 데 더 능숙했으며, 이는 안전 정렬 노력에 긍정적인 신호로 해석돼요.