VitaBench 2.0은 LLM 에이전트의 개인화 및 선제적 행동을 평가하는 새로운 벤치마크입니다. 이 벤치마크는 사용자의 선호도를 추론하고 활용하는 능력을 평가하며, 기존 벤치마크의 한계를 보완합니다. 최첨단 모델조차도 실제 개인화에 어려움을 겪으며, 실용적인 요구 사항과의 격차가 크다는 결과가 나왔습니다.