연구진이 개인화된 MCP 도구 사용 성능을 평가하는 새로운 벤치마크 'MCP-Persona'를 공개했어요. MCP-Persona는 Reddit, Xiaohongshu, Lark, Slack 등 다양한 개인 앱 환경을 시뮬레이션하며 SOTA 에이전트의 한계를 드러냈어요. 현재 GitHub에서 공개되어 있으며, 개인화된 도구 사용의 어려움을 파악하고 개선하는 데 기여할 것으로 기대돼요.