huggingface transformers 라이브러리 v5.4.0 버전이 출시됐어요. 이번 업데이트에는 PaddlePaddle 모델, Mistral 4, PI0, VidEoMT, UVDoc, SLANeXt, Jina Embeddings v3 등 다양한 모델이 추가됐어요.
VidEoMT는 프레임 간 정보 전달 메커니즘을 통해 기존 방식보다 5~10배 빠른 온라인 비디오 분할을 지원하며, UVDoc은 문서 이미지 왜곡을 교정하는 데 사용돼요.
Jina Embeddings v3는 8192 토큰까지 지원하는 다국어 임베딩 모델이며, Mistral 4는 지능형 모델과 추론 모델 기능을 통합한 하이브리드 모델이에요.
SLANeXt는 테이블 구조 인식에 특화된 경량 모델이며, PP-OCRv5_mobile_rec는 다국어 문서 텍스트 인식을 위한 경량 모델이에요.