사용자가 M1 Max 64GB MacBook Pro 환경에서 Hermes Agent를 사용하며 rapid-mlx, omlx, mlx-lm, ollama 추론 엔진을 벤치마크했습니다. mlx-chronos 커뮤니티 리더보드에 결과를 제출했으며, Qwen3.5-4B 모델을 사용했습니다. rapid-mlx가 속도와 메모리 효율성 측면에서 가장 우수했으며, 현재 Qwen 35b-A3b 모델을 rapid-mlx로 서비스하고 있습니다.