연구진이 Representation Distribution Matching(RDM)이라는 새로운 이미지 생성 패러다임을 발표했어요. RDM은 기존 프리트레인된 인코더를 고정하고 생성된 이미지와 참조 이미지의 특징 분포를 일치시키는 방식으로 1단계 이미지 생성기를 학습하는 방식이에요.
MMD를 개선하고 생성 배치 크기를 최적화하는 등 실험을 거쳐 ImageNet에서 SW_r14 점수 1.30을 기록하며 1단계 이미지 생성 분야 최고 성능을 달성했어요. PickScore 평가에서 이전 최고 모델보다 71.2% 더 높은 선호도를 기록했어요.
FLUX.2 모델을 RDM 방식으로 1단계로 전환하여 GenEval과 PickScore에서 기존 4단계 모델보다 더 나은 성능을 보여줬으며, 90개의 H200 GPU 시간을 절약했어요.