연구진이 Qwen-Image-2.0을 활용해 Qwen-Image-Flash를 개발했어요. few-step distillation의 학습 레시피를 체계적으로 조사하여 데이터 구성, 교사 가이드, 작업 혼합 3가지 요소를 분석했어요. 효과적인 few-step distillation은 목적 함수뿐 아니라 학습 파이프라인 전체의 체계적인 구성이 중요하다고 밝혔어요.
Qwen-Image-Flash는 unified text-to-image 생성 및 instruction-guided 이미지 편집 distillation에 활용돼요. 데이터 구성, 교사 가이드, 작업 혼합을 통해 비자명한 현상을 파악하고 개선했어요. 연구 결과, 학습 파이프라인의 원리 기반 구성이 중요함을 강조했어요.
논문은 Hugging Face에 공개됐으며, few-step distillation의 학습 레시피에 대한 새로운 시각을 제시하고 있어요. Qwen-Image-Flash 개발을 통해 데이터 구성, 교사 가이드, 작업 혼합의 중요성을 입증했어요.