사용자가 QAT 모델에 대한 만족감을 표하며, 어시스턴트 모델을 Llama CPP와 호환하여 사용하는 방법에 대한 질문을 남겼어요. 특히 Gemma 4 26BA4B Q4 QAT 모델을 MTP 및 어시스턴트 모델과 함께 Llama CPP에서 실행하는 방법을 문의했어요.
기존 MTP 방식과 am17an이 개발한 Llama CPP용 MTP 방식의 차이점에 대한 질문도 제기되었으며, 사용자는 Gemma 4 모델을 Llama CPP 환경에서 실행할 수 있는 구체적인 방법과 관련 정보를 찾고 있어요.