Qwen3.6이 Q4 버전 대비 코딩 에이전트 성능이 크게 향상돼 로컬 LLM 서버가 유료 API 수준의 성능을 낼 수 있게 됐어요. Ollama 사용을 중단하고 llama.cpp 서버로 전환해 성능을 개선했음을 밝혔어요. MTP 기술 덕분에 3090 GPU로도 20~50 토큰/초의 빠른 속도로 작동하며 발열도 적어요.