Apple이 MLX LM 서버를 공개하여 M5 칩의 신경 가속기를 활용한 로컬 LLM 추론을 지원합니다. M5 칩은 프롬프트 처리 성능을 크게 향상시키고, MLX LM 서버는 연속 배치 처리를 통해 여러 에이전트 요청을 동시에 처리할 수 있습니다. 개발자는 pip를 통해 MLX LM을 설치하고 로컬 서버 주소를 에이전트 도구에 연결하여 사용할 수 있습니다.