Gemma 4 12b QAT 모델의 툴 호출 성능이 기대에 못 미쳐 개발자 작업에 어려움을 겪고 있다는 의견이 Reddit에 올라왔어요.
Q5_K_L 버전 대비 코드 생성량과 품질이 현저히 떨어지며, 모델 자체의 오류로 인해 툴 응답 태그가 잘못 설정되는 문제가 발생했어요.
속도(60 토큰/초)는 빠르지만, 일관성 없는 결과로 인해 VS Code 확장 프로그램이나 스토리 작성 등 실질적인 작업에 활용하기 어렵다고 해요.
툴 기반 워크플로우나 개발자 확장에 의존하는 사용자들은 기존 Q5_K_L 버전을 사용하는 것이 좋다고 조언했어요.