Kimi K2.6가 가장 빠른 속도를, GLM 5.1이 가장 세련된 성능을 보여줬어요. DeepSeek V4는 가장 포괄적인 기능을 제공하며, Xiaomi MiMo는 가장 느린 속도를 기록했어요. MiMo의 MoE가 Kimi K2.6보다 더 많은 활성 파라미터를 사용해 토큰당 연산을 수행하는 것이 원인으로 분석돼요. DeepSeek V4는 MLA 기술을 활용해 KV 캐시를 약 75% 압축해 장기 에이전트 루프에 더 적합합니다.