Gemma 4 12B 모델의 버그 탐색 벤치마크 결과, 기본 설정에서는 추론 기능이 비활성화되어 있어 Jinja 템플릿 설정을 변경해야 합니다.
LM Studio에서 Gemma 4 12B 모델의 성능을 최적화하려면 템플릿에 `{%- set enable_thinking = true %}` 를 추가하고 시작/종료 토큰을 `<|channel>thought` 및 `<channel|>` 로 설정해야 합니다.
최적의 추론 품질을 위해 온도 1.0, top_p 0.95, top_k 64 등의 공식 Google 파라미터를 사용하고, 백엔드 설정을 올바르게 구성하는 것이 중요합니다.