Macbook M5 Max에서 Qwen3.6-27B-MTP Q6_K_XL 모델을 테스트한 결과, MTP 적용 시 성능 향상이 크지 않았어요. non MTP 모델과 비교했을 때 22.3tps로, 기대했던 만큼의 큰 개선은 없었어요. 사용자가 설정 문제일 가능성을 제기하며 관련 설정을 공유했어요.
llama.cpp를 이용한 테스트에서 non MTP 모델은 19tps, MTP 모델은 22.3tps를 기록했어요. 사용자는 --temp, --top-p, --top-k, --min-p, --cache-ram, --batch-size, --ubatch-size 등의 설정을 동일하게 사용했어요.
기존에 MTP 적용 시 성능 향상이 크다는 보고가 있었지만, 이번 테스트에서는 그만큼의 차이가 나타나지 않았다고 언급하며, 사용자의 설정 문제일 가능성을 시사했어요.