Pulse · AI 뉴스

LLM의 비대화적 설득 능력 평가: 계획 및 행동을 통한 믿음 상태 유도

OpenAI · 2026-07-01

연구진은 LLM이 대화 없이 계획과 행동을 통해 다른 에이전트의 믿음 상태를 유도하는 능력을 평가하는 새로운 프레임워크 NCP-ToM을 제시했어요.

GPT-5는 80%의 성공률로 인간 참가자를 능가하며, 인간보다 특정 목표 달성을 위한 믿음 상태 유도에 더 효과적이었어요.

연구 결과, LLM과 인간 모두가 진실한 믿음 상태를 유도하는 데 더 능숙했으며, 이는 안전 정렬 노력에 긍정적인 신호로 해석돼요.

##LLM##TheoryofMind##NCP-ToM##GPT-5
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기