사용자가 3090 GPU 환경에서 Qwen3.6-27B 모델을 llama.cpp로 실행하며 50 t/s 속도를 기록했습니다. 100K 컨텍스트 사이즈를 사용했으며, Spec draft 3은 3090 GPU에 부담이 있어 draft 2를 사용했습니다. 컨텍스트 사이즈가 느려짐에도 불구하고 대부분의 작업에 100K가 충분하다고 판단했습니다.