연구진은 LLM 에이전트의 감정적 측면을 평가하는 새로운 벤치마크 HEART-Bench를 공개했어요. HEART-Bench는 Big Five 성격 특성을 기반으로 한 11가지 인간 캐릭터를 구축하고, 각 캐릭터는 1,000개의 개발 단계에 따른 기억으로 구성돼 있어요. DIAMONDS 프레임워크에 따라 설계된 64가지 의사 결정 시나리오를 통해 LLM 에이전트가 일관된 심리적 프로필에 따라 행동하는지 평가해요.