사용자가 Qwen/Claude 기반 증류 모델의 성능에 대한 우려를 제기했어요. 4,000개 정도의 샘플로 튜닝하는 것은 모델 품질을 개선하기에 충분하지 않으며, 오히려 성능을 저하시킬 수 있어요. DeepSeek-R1 증류 모델처럼 70만 개 이상의 샘플을 사용해야 의미 있는 성능 향상을 기대할 수 있어요.
Qwopus와 같은 증류 모델은 Opus와 유사한 추론 스타일을 보이지만, 원본 Qwen 모델보다 성능이 좋지 않으며 환각 현상이나 응답 시간 지연과 같은 문제가 발생할 수 있어요. 사용자는 특정 사용 사례에 맞게 직접 테스트해 볼 것을 권장해요.
증류 모델을 사용할 때 원본 모델보다 우수하다고 맹목적으로 믿지 말고, 잠재적인 일관성 문제나 오류를 확인해야 해요.