Pulse · AI 뉴스

샤오미, DFlash·Persistent 커널 기반 MiMo V2.5 1000~3000TPS로 제공

MiMo · 2026-06-14

샤오미가 DFlash와 Persistent 커널을 활용해 MiMo V2.5를 초당 1000~3000건 처리 속도로 제공하고 있어요. DFlash 모델이 공개됐고, 오픈소스 배포도 약속됐어요.

MiMo V2.5는 DFlash 모델과 Persistent 커널을 통해 성능을 개선했어요. DFlash 모델은 곧 오픈소스로 공개될 예정이며 샤오미는 이를 통해 LLM 추론 속도 향상에 기여할 것으로 기대돼요.

##MiMo##샤오미##DFlash##LLM

매일 핵심 AI 소식을 한국어로, 빠르게