MTP(Mixture of Total Preference)가 llama.cpp에 적용될 예정입니다. DeepSeekv3, Qwen3.5, GLM4.5+ 등 다양한 모델이 MTP를 지원합니다. MTP 가중치가 준비될 때까지는 HF 가중치를 다운로드하여 gguf 형식으로 변환해야 합니다.