연구진이 생성 모델의 모드 붕괴 문제를 해결하기 위해 가이드 잠재력 후류에서 초기 노이즈를 선택하는 새로운 방법 'DivIn'을 제시했어요. 기존 가우시안 초기화 방식은 잠재력을 고려하지 않아 붕괴로 이어질 수 있다는 점을 지적했어요. DivIn은 Langevin 동역학을 활용해 초기 노이즈를 다양성이 풍부한 영역으로 유도하며 데이터 매니폴드에 고정해요.
Diffusion 및 Flow Matching 모델 모두에 적용 가능한 DivIn은 클래스-이미지 및 텍스트-투-이미지 시나리오에서 기존 방식보다 우수한 성능을 보여줘요. 특히 기존 생성 경로 기반 방법과 함께 사용하면 다양성과 품질 모두를 향상시킬 수 있어요.
DivIn은 초기화 단계에서 다양성을 유도하는 방식으로, 기존 방식과 병행하여 사용하면 더욱 효과적이며, 생성 모델의 다양성 확보에 기여할 수 있어요.