사용자가 RTX 3090에서 Qwen3.6-27B를 활용해 Claude를 대체한 멀티 에이전트 시스템을 2주간 테스트했어요. 계획 생성, 메모리 추출, 하위 에이전트 결과 검토 등에서는 Claude와 유사한 성능을 보였지만, 도구 호출 신뢰성, 장문 컨텍스트 처리, 연쇄 실패 처리에서 한계가 있었어요. Qwen3.6이 도구 호출 오류율을 2% 수준으로 개선하면 클라우드 기반 추론의 필요성이 줄어들 것으로 예상돼요.