Reddit 사용자가 unsloth와 bartowski의 MTP ggufs를 비교 분석한 결과, bartowski의 ggufs가 더 큰 용량을 차지하지만, 모델 크기가 클수록 MTP를 사용하는 것이 유리할 수 있다는 점을 발견했어요.
Qwen3.5-9B 모델의 경우, MTP를 사용하면 전반적으로 더 빠른 속도를 얻을 수 있으며, Qwen3.6-27B 모델에서는 속도 향상이 매우 두드러지게 나타나는 것으로 확인됐어요.
MoE 모델의 경우, bartowski ggufs가 더 큰 용량을 차지하지만, 속도 향상이 크지 않으므로, 속도가 중요하면 unsloth를 사용하는 것이 좋으며, MoE ggufs 크기 차이에 대한 궁금증을 제기했어요.