연구진은 디퓨전 모델의 증류와 강화 학습 미세 조정을 결합한 새로운 프레임워크인 RMMD를 제안했어요. RMMD는 샘플링 루프를 활용해 온-정책 학습을 가능하게 하고, 증류 손실을 KL 정규화의 대리 지표로 사용해요.
ImageNet 평가 결과, RMMD는 DI++나 HyperNoise와 같은 기존 방식보다 더 나은 성능을 보여줬어요. 특히 GenCast 모델을 증류하면서 CRPS 지표를 최적화해 7.5배 빠른 속도를 달성하고, 93%의 기상 변수에서 원본 모델보다 뛰어난 성능을 보였어요.
RMMD는 복잡한 고차원 과학 분야에도 적용 가능함을 입증하며, 기상 예측 모델 GenCast의 효율성과 정확도를 향상시키는 데 기여했어요.