Pulse · AI 뉴스

Gemma4 26b Apex 양자화 모델, 뛰어난 성능 보여줘

Gemma · 2026-05-23

사용자가 Gemma4 26b a4b 모델에 Mudler의 Apex 양자화 방식을 적용해 38tps를 기록했어요. 90,000 컨텍스트에서도 루프 없이 품질 저하 없이 작동했어요. 기존 양자화 방식 대비 성능이 우수하다고 평가받았어요.

RX 9060 XT 16GB 환경에서 llama.cpp Vulkan으로 테스트했고, 기존 양자화 방식은 50,000 컨텍스트에서 루프 현상이 발생했어요. 사용자는 이 방식이 널리 더 나은 양자화 방식은 아니지만 시도해볼 가치가 있다고 판단했어요.

##Gemma##양자화##llama.cpp
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기