샤오미가 DFlash와 Persistent 커널을 활용해 MiMo V2.5를 초당 1000~3000건 처리 속도로 제공하고 있어요. DFlash 모델이 공개됐고, 오픈소스 배포도 약속됐어요. MiMo V2.5는 DFlash 모델과 Persistent 커널을 통해 성능을 개선했어요. DFlash 모델은 곧 오픈소스로 공개될 예정이며 샤오미는 이를 통해 LLM 추론 속도 향상에 기여할 것으로 기대돼요.