Mistral medium 3.5 128B 모델을 MLX 4bit로 변환하여 약 70GB 크기로 만들었어요. 비전 인코더를 포함하고 있으며, 256K 컨텍스트를 지원하고, 툴 호출 기능도 작동해요. M2 Max 96GB 환경에서 초당 약 5토큰의 속도를 보여주고 있으며, 샘플링 시 적절한 파라미터 설정을 추천해요.