연구진은 LLM의 부족한 마음 이론(ToM) 추론 능력을 개선하기 위해 ToM-PD라는 새로운 과제를 제시했어요. ToM-PD는 BDI 프레임워크 기반으로 정신 상태 간의 의존성을 명시적으로 모델링하는 방식이에요.
Qwen3-8B 모델에 TTBYS 프레임워크를 적용한 결과, GPT-5보다 원하는 것, 믿음, 설득 전략 예측 성능이 각각 1.20%, 22.80%, 16.97% 향상됐어요.
연구팀은 ToM-BPD라는 대규모 데이터셋을 구축하여 연구를 지원하고, TTBYS가 추론의 해석 가능성과 일관성을 높인다는 것을 확인했어요.