Minimax M3 (4bit MLX) 모델을 Mac Studio M3u 환경에서 벤치마크 테스트했어요. 단일 요청 시 최대 24326.6ms의 TTFT(처리 시간)이 소요됐어요. 65536 토큰 프롬프트 테스트에서는 토큰/초 속도가 176.0으로 감소했어요.
배치 크기를 늘려 4배로 확장했을 때 토큰/초 속도가 49.9로 향상됐고, E2E 시간은 19.706초로 줄었어요. 이 테스트는 512GB Mac Studio M3u 환경에서 진행됐어요.
Reddit 사용자가 Minimax M3의 초기 벤치마크 결과를 공유하며, 다양한 프롬프트 크기와 배치 크기에서의 성능 변화를 보여줬어요.