사용자가 Qwen 3.6 27B 모델 실행 시 --spec-type 및 --spec-draft-n-max 파라미터 설정 시 성능 저하를 경험했어요. 파라미터 제거 시 GPU 사용량이 475W로 증가하고 처리 속도가 70t/s로 향상되는 반면, 설정 시에는 300W, 30t/s로 감소했어요. 최근 llama.cpp 업데이트 이후 이러한 현상이 발생했으며, 원인을 파악 중이에요.