Reddit 사용자가 GTX 1060 6GB 메모리 기반 구형 델 T5810 워크스테이션에서 Qwen3.6-35B-a3b-mtp 모델을 LMStudio를 통해 실행하는 데 성공했어요. 컨텍스트 길이 131072, GPU 오프로드 41 설정으로 챗 기능 사용 가능했어요. Prefill 시 약 130-150 TPS, Decode 시 약 16 TPS 성능을 보여줬어요.
Qwen3.6-35B-a3b-mtp 모델은 KV 양자화 Q4_0, MTP max draft 3, CPU threadpool size 16 설정으로 구동됐어요. 8개의 전문가를 사용하며, MOE 레이어 41개를 CPU로 오프로드했어요. Windows 환경에서 실행 가능함을 입증했어요.
이 사용자는 10년 된 Dell T5810 워크스테이션에서 LMStudio를 통해 모델을 실행했으며, 32GB DDR3 메모리와 E5-2698v3 프로세서, GTX 1060 6GB GPU를 사용했어요. 과거 채굴에 사용했던 GPU가 투자 대비 높은 수익을 냈다고 언급했어요.