Hugging Face는 Transformers 라이브러리 v5.2.0 버전을 출시하며, Mistral AI의 실시간 음성 인식 모델 Voxtral Realtime, zAI의 GLM-5, Qwen 팀의 Qwen3.5, VibeVoice Acoustic Tokenizer 등 다양한 모델을 추가했습니다.
GLM-5는 744B 파라미터 규모로, DeepSeek Sparse Attention(DSA)을 통합하여 성능을 향상시켰으며, 강화 학습을 통해 모델의 능력을 더욱 발전시켰습니다.
Qwen3.5는 397B 파라미터 규모의 최초 모델로, 선형 어텐션과 희소 전문가 혼합 아키텍처를 활용하여 효율적인 추론 성능을 제공하며, 지원 언어를 119개에서 201개로 확대했습니다.