Pulse · AI 뉴스

Qwen 3.6 27B MTP: spec-type 및 spec-draft-n-max 설정 시 성능 저하

Qwen · 2026-06-06

사용자가 Qwen 3.6 27B 모델 실행 시 --spec-type 및 --spec-draft-n-max 파라미터 설정 시 성능 저하를 경험했어요.

파라미터 제거 시 GPU 사용량이 475W로 증가하고 처리 속도가 70t/s로 향상되는 반면, 설정 시에는 300W, 30t/s로 감소했어요.

최근 llama.cpp 업데이트 이후 이러한 현상이 발생했으며, 원인을 파악 중이에요.

##Qwen##llama.cpp##성능저하##GPU##최적화

매일 핵심 AI 소식을 한국어로, 빠르게