huggingface transformers 라이브러리의 v5.3.0 버전이 출시되었어요. EuroBERT, VibeVoice ASR, TimesFM2.5 등 다양한 새로운 모델이 추가되었답니다.
EuroBERT는 유럽어와 널리 사용되는 언어를 지원하며 최대 8192 토큰 시퀀스를 처리할 수 있어요. VibeVoice ASR은 24kHz 오디오를 처리하여 강력한 음성-텍스트 변환 기능을 제공합니다.
TimesFM2.5는 시간 시계열 예측을 위한 모델이고, PP-DocLayoutV2는 문서 레이아웃 분석에 특화되었으며, Higgs Audio V2는 1천만 시간 이상의 오디오 데이터로 사전 훈련된 오디오 모델이에요.