GLM 5.1이 코딩 작업에서 가장 큰 성과를 보여줬으며, 간단한 작업(1~6)은 안정적으로 처리합니다. Kimi K2.6는 GLM 5.1과 비슷한 성능을 보이지만, 더 큰 모델 크기로 인해 메모리 관리에 약간의 불편함이 있습니다. Minimax 2.7은 빠르지만, GLM/Kimi에 비해 코드 생성 효율성이 떨어집니다. Gemma 4 31B는 mlx 지원 문제로 아직 안정화되지 않았으며, 추후 개선을 기대합니다.