Sokann이 제공하는 Qwen 3.6 GGUF 모델이 16GB GPU 사용자들을 위해 공개되었어요. Qwen3.6-27B 모델을 5070 Ti에서 4.256bpw로 실행하며 50000 컨텍스트 윈도우를 확보할 수 있었어요. 다른 양자화 모델과 비교했을 때 VRAM 효율성이 뛰어나며, 약간의 확률 왜곡이 있지만 성능은 준수해요.