연구진은 LLM의 중국 인터넷 아열어인 '초샹어' 처리 능력을 평가하는 벤치마크 '마우스'를 새롭게 선보였어요. 현재 최고 성능 모델(SOTA)은 문맥적 의미 이해가 필요한 작업에서는 괜찮은 성능을 보이지만, 여러 작업에서 명확한 한계를 드러냈어요. 연구는 다문화 통합과 진화하는 인터넷 언어 역학 연구를 촉진하는 것을 목표로 하며, 관련 코드와 데이터는 공개되었습니다.