llama.cpp 프로젝트에 MTP 지원을 위한 개선 사항이 반영되어 이미지 지원 및 버그 수정이 이루어졌습니다. havenoammo 사용자가 MTP 모델 실행을 쉽게 하기 위해 다양한 환경을 지원하는 Docker 이미지를 제작하여 공개했습니다. Unsloth에서 Qwen 3.6 모델에 대한 MTP 모델을 출시하여 기존 모델을 대체했습니다. MTP 레이어의 양자화 수준에 따라 속도와 VRAM 사용량 간의 균형을 조절할 수 있습니다.