Qwen-Image-2.0-RL은 Qwen-Image-2.0 확산 모델의 시각적 품질과 지시사항 준수 능력을 향상시키는 파이프라인이에요. 텍스트-이미지 생성 시 정렬, 심미성, 인물 표현 충실도를 평가하는 복합 보상 모델을 구축하고, 이미지 편집 시 지시사항 정확도와 얼굴 신원 보존을 다루는 보상 시스템을 활용했어요. Qwen-Image-Bench에서 57.84의 종합 점수를 기록하며, 기본 모델 대비 2.61점 향상된 성능을 보여줬어요.