Pulse · AI 뉴스

Qwen 3.6 35B 모델, RTX 5090으로 187t/s 속도 구현, 120K 컨텍스트 사이즈 지원

Qwen · 2026-04-17

사용자가 Qwen 3.6 35B 모델을 RTX 5090 GPU에서 실행하며 187t/s의 빠른 추론 속도를 달성했다는 내용을 공유했습니다.

실험 환경은 32GB RTX 5090 GPU, Q5 K S 양자화, 120K 컨텍스트 사이즈, Thinking Mode Off, 온도 0.1 설정을 사용했습니다.

이 정보는 Qwen 모델의 성능과 다양한 하드웨어 환경에서의 활용 가능성을 보여주는 사례로, 사용자 커뮤니티에 공유되어 논의를 이끌었습니다.

##Qwen##RTX5090##양자화

매일 핵심 AI 소식을 한국어로, 빠르게