kmarble.dev가 Radeon 7900 XTX에서 Qwen3.6-35B-A3B와 Gemma4-26B-A4B를 비교 분석했어요. 동일한 32K 컨텍스트 예산과 6가지 실제 업무 프롬프트를 사용했어요.
Qwen은 토큰 생성 속도가 빠르지만, 답변을 위해 더 많은 토큰을 사용해 Gemma보다 20% 느렸어요. Qwen은 Gemma보다 2배 많은 14,811개의 토큰을 생성했어요.
코드 리뷰 작업에서 Gemma는 Qwen이 놓친 `TypeError`를 발견했고, 두 모델은 상반된 답변을 제시하는 등 품질 면에서도 차이를 보였어요. 배치 작업에는 Qwen, 지연 시간 민감한 작업에는 Gemma를 사용하는 것이 효율적이에요.