사용자 연구용 코드를 이해하는 LLM 성능 테스트에서 Qwen 3.6 35B A3B가 가장 뛰어난 성능을 보였습니다. 최근 몇 달 사이 Devstral Small 2를 포함한 소규모 로컬 모델들의 코드 이해 능력이 크게 향상되었습니다. Qwen 3.6 35B A3B는 Anthropic Claude Opus 4.7에 버금가는 능력을 보여줬습니다.