Qwen3.6-27B 모델이 출시된 후, Hugging Face에 NVFP4와 MTP가 공개되었어요. vLLM 0.19 빌드를 활용하여 RTX 5090에서 218k 컨텍스트 윈도우 환경에서 초당 80토큰 처리 속도를 낼 수 있어요. Reddit LocalLLaMA 커뮤니티에서 Qwen3.5-27B 모델을 RTX 5090에서 vLLM으로 실행하는 방법에 대한 정보가 공유되었어요.