연구진은 인간의 정신 상태 추론 능력을 갖춘 AI 에이전트 개발을 위해 MindZero라는 새로운 프레임워크를 공개했어요.
MindZero는 강화 학습을 통해 다중 모델 LLM(MLLM)을 훈련하여 효율적이고 강력한 온라인 정신적 추론을 가능하게 하며, 명시적인 정신 상태 어노테이션 없이도 학습이 가능해요.
실험 결과 MindZero는 기존 모델 기반 방식보다 정확성과 효율성 모두에서 뛰어난 성능을 보이며, 정신적 추론을 자율적으로 학습할 수 있음을 입증했어요.