데이터 프라이버시 및 무료 LLM 사용을 위해 클라우드 모델을 떠나는 개발자들이 늘고 있어요. 컨테이너화된 오프라인 코딩 환경에서 외부 네트워크 호출 없이 작업하는 방식이에요. 주력 모델은 Qwen3.6 35B-A3B로, 활성 파라미터 30억 개를 사용해 빠른 속도를 제공해요.
Qwen3.6 35B-A3B는 128GB RAM을 요구하며, 700만원 상당의 GPU가 필요해요. 이러한 제약에도 불구하고, 로컬 모델 사용은 데이터 보안 및 비용 절감에 기여한다는 의견이에요.