러시아어로 작성된 이 글은 Qwen-3.6-27B를 포함한 여러 모델의 코딩 성능을 비교 분석한 내용을 담고 있습니다. 특히, 어려운 작업에서 로컬 모델과 클라우드 모델의 성능 차이를 실험적으로 확인했습니다.
Gemma-4-31B는 완전히 실패했고, Codex-Spark는 작동하지 않는 아름다운 코드를 생성했으며, Claude Haiku는 상세한 문서와 Git 브랜치를 생성했지만 테스트가 부족했습니다.
Qwen-3.6-27B는 거의 완벽한 구현을 보여줬지만, train-to-test leak 문제가 있었으며, 로컬 환경에서 8시간 동안 실행되는 등 속도 문제가 있었습니다.