Pulse · AI 뉴스

Gemma 4 모델 벤치마크 결과: 3개 GPU 환경

Gemma · 2026-06-15

Reddit 사용자가 AMD Ryzen 5 3600 CPU와 3개의 GTX-1070 GPU 환경에서 Gemma 4 모델을 벤치마크했어요. 모델 크기에 따라 1분 29초에서 3분 35초까지 소요됐으며, 26B 모델은 QAT 버전이 가장 빠른 속도를 보였어요. 특히 Gemma 4-26B-A4B-it-qat-UD-Q4_K_XL 모델은 코딩 작업에서 높은 정확도를 보여줬어요.

GPU는 개당 120~122W로 전력 제한을 설정했는데, 전력 소비량 감소와 함께 약간의 성능 저하가 있었어요. 벤치마크 결과는 GitHub의 llama.cpp 릴리스를 통해 확인할 수 있어요.

각 GPU는 1x, 4x, 16x PCIe 슬롯에 장착되었으며, PCIe 1x 익스텐더 사용으로 모델 로딩 시간이 느려졌지만 추론 속도에는 일관성을 유지했어요.

##Gemma##모델벤치마크##GPU
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기