연구진이 Representation Distribution Matching(RDM) 기법을 활용해 1단계 이미지 생성 모델을 개발했어요. RDM은 생성된 이미지와 참조 이미지의 특징 분포를 비교하는 방식으로 학습해요. 실험 결과, RDM은 ImageNet에서 SW_r14 점수 1.30을 기록하며 기존 1단계 모델을 능가했어요. 또한, FLUX.2 모델을 1단계로 변환하여 GenEval과 PickScore에서 더 높은 성능을 달성했어요.
MMD 비교 방식과 적정 배치 크기(2048 이상)를 최적화하고, 다양한 인코더를 활용해 이미지의 진실성을 확보하는 것이 중요했어요. 연구진은 iRDM이라는 개선된 RDM 기법을 통해 인간 선호도 지표인 PickScore에서 71.2%의 우위를 점하며 1단계 이미지 생성의 새로운 가능성을 제시했어요.
1단계 RDM 모델은 90개의 H200 GPU 시간을 사용하여 4단계 FLUX.2 모델을 능가하는 성능을 보여주며, 이미지 생성 분야의 발전에 기여할 것으로 기대돼요.