사용자가 Qwen 3.6 35B 모델을 RTX 5090 GPU에서 실행하며 187t/s의 빠른 추론 속도를 달성했다는 내용을 공유했습니다. 실험 환경은 32GB RTX 5090 GPU, Q5 K S 양자화, 120K 컨텍스트 사이즈, Thinking Mode Off, 온도 0.1 설정을 사용했습니다. 이 정보는 Qwen 모델의 성능과 다양한 하드웨어 환경에서의 활용 가능성을 보여주는 사례로, 사용자 커뮤니티에 공유되어 논의를 이끌었습니다.