MiMo-V2.5 모델을 llama.cpp에서 텍스트-텍스트 추론을 지원하는 PR이 제출되었어요. Q8_0 및 MoE 최적화 양자화 모델이 Hugging Face에 공개되었으며, Q4_K_M 모델의 NAN 이슈가 수정되었어요. 다른 양자화 전문가들도 곧 자체 양자화 모델을 공개할 예정이에요.