Pulse · AI 뉴스

Gemma 4 12b QAT 모델, 툴 호출 성능 저하… 개발자 작업에 부적합

Gemma · 2026-06-08

Gemma 4 12b QAT 모델의 툴 호출 성능이 기대에 못 미쳐 개발자 작업에 어려움을 겪고 있다는 의견이 Reddit에 올라왔어요.

Q5_K_L 버전 대비 코드 생성량과 품질이 현저히 떨어지며, 모델 자체의 오류로 인해 툴 응답 태그가 잘못 설정되는 문제가 발생했어요.

속도(60 토큰/초)는 빠르지만, 일관성 없는 결과로 인해 VS Code 확장 프로그램이나 스토리 작성 등 실질적인 작업에 활용하기 어렵다고 해요.

툴 기반 워크플로우나 개발자 확장에 의존하는 사용자들은 기존 Q5_K_L 버전을 사용하는 것이 좋다고 조언했어요.

##Gemma##모델성능##툴콜링##QAT##코드생성

매일 핵심 AI 소식을 한국어로, 빠르게