Pulse · AI 뉴스

Qwen 3.6 35B A3B 2개 5060TI 환경 최적화 방법

Qwen · 2026-05-14

사용자가 Qwen 3.6 35B A3B 모델을 2개의 5060TI (32GB VRAM) 환경에서 LM Studio를 통해 실행 중입니다.

Q4 양자화로 전체 컨텍스트를 사용하며 90t/s의 속도를 기록했습니다.

더욱 최적화하거나 Q6 또는 Q8 양자화로 업그레이드할 수 있는 팁을 요청했습니다.

##Qwen##최적화##양자화
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기