Qwen 모델의 스카폴드를 변경하여 벤치마크 성능을 19.11%에서 45.56%로 향상시킨 후속 실험 결과가 나왔어요. little-coder를 활용한 Qwen3.6 35B는 공개 Polyglot 벤치마크에서 78.7%의 성공률을 기록하며 상위 10위 안에 들었어요. 연구자는 로컬 코딩 모델과 클라우드 모델 간의 성능 차이가 모델 스카폴드 불일치 때문일 수 있다고 분석했어요.