RTX 5080 (RAM 오프로딩)으로 자동 완성 및 에이전트 코딩을 위한 풀 스택 툴박스를 구축했습니다.
자동 완성에는 Qwen2.5-Coder-7B-Instruct 모델을, 에이전트 코딩에는 Qwen3.6-35B-A3B 모델을 사용했습니다. Qwen2.5는 인필에 가장 적합하며, Qwen3.6은 적절한 프롬프트를 제공하면 에이전트 코딩에 효과적입니다.
Qwen3.6-35B-A3B 모델은 3B개의 활성 파라미터를 사용하여 비교적 빠른 속도를 유지하며 8GB VRAM에 들어갑니다.