연구진은 LLM의 수화 이해 능력을 평가하기 위해 중국 표준 수화 벤치마크인 CNSL-bench를 새롭게 개발했어요. CNSL-bench는 공식 표준 사전에 기반하여 의미의 일관성을 확보하고, 텍스트 설명, 이미지, 수화 영상 등 다양한 모달리티를 지원해요. 현재 MLLM은 인간 수준의 성능에 미치지 못하며, 입력 모달리티 및 수화 표현 방식에 따라 성능 차이가 뚜렷하게 나타나는 것으로 확인됐어요.