Ruler-Dev 사용자가 DFlash, PolarQuant, Caveman을 결합한 Mio 프로젝트를 공개하여 로컬 LLM의 성능을 향상시켰어요.
Mio는 M4 Max에서 Qwen 3.6 35B-A3B 모델을 사용할 때 200 Tok/s 이상의 속도를 보여주며, 기존 대비 빠른 속도와 편리한 사용성을 제공해요.
GitHub 저장소를 통해 프로젝트를 공유하며, 코드 기반 에이전트, OpenAI 호환 API, Claude 스타일 웹 UI 등 다양한 실행 방식을 지원해요.