연구진은 다중 에이전트 LLM 벤치마크의 한계점을 지적하며, 협상 게임을 통해 동적 그라운딩의 실패와 복구 과정을 분석했습니다. 분석 결과, 에이전트들은 공유된 상호작용 기록 부재, 고착된 초기 제안, 공정성에 대한 과도한 의존, 약속 추적 실패 등의 문제점을 보였습니다. 연구는 정보 교환만으로는 부족하며, 공동 계획 수립, 약속, 실행을 포함하는 동적 그라운딩 과정이 협상의 핵심이라는 것을 보여줍니다.