연구진이 Any-Length Discrete Diffusion 모델의 효율적인 미세 조정을 위한 통합 프레임워크인 A2D2를 발표했어요. A2D2는 삽입 및 마스킹 정책과 품질 기반 추론 일정을 함께 최적화하여 보상을 기반으로 모델을 미세 조정해요.
Radon-Nikodym 도함수를 활용하여 이론적으로 보상에 치우친 시퀀스 분포로 수렴하도록 보장하며, 샘플 없이도 가능해요.
A2D2는 기존 방식 대비 보상 최적화 성능을 개선하고 생성 유연성과 정확도를 높여요.