Llama.cpp MTP 기능을 활용하여 Qwen3.6-27B 모델을 RTX 3090에서 구동한 결과, 작업 완료 시간이 41% 단축되었습니다. MTP 적용 시 PP 처리 속도는 42% 감소했지만, TG 처리 속도는 85% 향상되어 전체 작업 시간을 줄이는 데 기여했습니다. PP 처리량이 많은 경우를 제외하고는 대부분의 사용 사례에서 MTP를 적용하면 성능 향상을 기대할 수 있습니다.