Pulse · AI 뉴스

MiMo-V2.5 GGUF 모델, llama.cpp 지원 및 Hugging Face 공개

MiMo-V2.5 · 2026-04-29

MiMo-V2.5 모델을 llama.cpp에서 텍스트-텍스트 추론을 지원하는 PR이 제출되었어요.

Q8_0 및 MoE 최적화 양자화 모델이 Hugging Face에 공개되었으며, Q4_K_M 모델의 NAN 이슈가 수정되었어요.

다른 양자화 전문가들도 곧 자체 양자화 모델을 공개할 예정이에요.

##모델출시##llama.cpp##GGUF
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기