huggingface transformers 라이브러리의 v5.5.2 패치 릴리스가 진행되었습니다. 이번 업데이트는 Gemma 4 모델의 추론 최적화 및 가중치 이름 불일치 문제를 해결하는 데 중점을 두었습니다. k/v 상태 공유 관련 오류 수정과 일부 모델의 변환 매핑 개선이 포함되었습니다.
MoE(Mixture of Experts)를 Gemma 4 TP 계획에 추가하고, 캐시 사용 시 k/v 상태 공유 문제를 해결하는 등 Gemma 4 모델의 성능 향상을 위한 수정 사항이 반영되었습니다. 가중치 로딩 시 공유 가중치를 무시하도록 변경하여 안정성을 높였습니다.
VLMs(Vision-Language Models) 변환 매핑 오류를 수정하여 다양한 모델과의 호환성을 개선했습니다.