RTX 5090 환경에서 llama.cpp를 사용하여 Qwen3.6-27B 모델의 MTP (Mixture of Experts) 지원을 테스트했습니다. MTP 활성화/비활성화 시 성능 비교를 위해 동일한 GGUF 파일을 사용하고, `--spec-type draft-mtp` 플래그만 변경했습니다. 짧은 이야기 생성 및 HTML 기반 플래피 버드 클론 코딩 작업에서 MTP 활성화 시 성능 변화를 측정했습니다.