연구진은 스코어 기반 확산 샘플링의 시간 할당 문제를 연구하며, 고정된 처방에 의존하는 기존 방식의 한계를 극복하고자 했습니다.
Adaptive Reparameterized Time (ART)는 샘플링 시계 속도를 제어하여 균일한 그리드를 유도하고 확산 시간에 따른 적응형 시간 단계를 생성하는 연속 시간 제어 방식을 제시합니다.
ART-RL은 ART 시간 워핑 속도를 복구하는 가우시안 정책을 학습하는 연속 시간 강화 학습 문제로 스케줄 학습을 전환하는 랜덤화된 ART-RL 제형을 도입하여 기존 확산 샘플러에 쉽게 통합할 수 있습니다.