연구진은 LLM의 다국어 및 다문화 능력 평가의 한계를 극복하기 위해 새로운 벤치마크 '가오야오'를 개발했어요. 가오야오는 문화적 층위와 인지 하위 층위를 통합한 평가 프레임워크를 제시하고, 26개 언어와 51개 국가/지역을 포함하는 광범위한 데이터를 제공해요. 가오야오 벤치마크를 통해 LLM의 지리적 성능 차이와 과제별 격차를 진단하고, 향후 연구 방향을 제시했어요.