사용자가 32GB RAM과 4070 8GB GPU로 Qwen3.6-35B-A3B 모델을 안정적으로 구동하며 코딩 작업에 활용하는 방법을 공유했어요.
Qwen3.6은 제한적인 작업에 적합하며, GLM 5.2를 활용해 코드 리뷰 및 작업 계획 수립을 하고 있어요.
Qwen3.6 모델의 지식 격차를 파악하고 개선하는 피드백 루프를 구축하여 코드 품질을 향상시키고 있어요.
llama-server를 사용해 Qwen3.6 모델을 구동하며, 배터리 사용 시 15 tokens/s, 고전력 시 19 tokens/s 속도를 보여요.