Kaitchup의 테스트 결과, Qwen 모델이 벤치마크 점수에 집중한 반면 Gemma 4 31B는 토큰 사용 효율성이 뛰어난 것으로 나타났습니다. Gemma 4 31B는 추론 속도가 약간 느리지만, 토큰 사용량 감소로 인해 전체 작업 시간을 단축할 수 있다는 결과가 나왔습니다. 본 테스트는 Gemma 모델의 DFlash, MTP 등 추가 최적화에 대한 기대감을 높이고 있습니다.