Pulse · AI 뉴스

초기화가 승리의 절반: 가이드 잠재력 후류에서 다양한 이미지 생성

arXiv cs.CV · 2026-06-02

연구진이 생성 모델의 모드 붕괴 문제를 해결하기 위해 가이드 잠재력 후류에서 초기 노이즈를 선택하는 새로운 방법 'DivIn'을 제시했어요. 기존 가우시안 초기화 방식은 잠재력을 고려하지 않아 붕괴로 이어질 수 있다는 점을 지적했어요. DivIn은 Langevin 동역학을 활용해 초기 노이즈를 다양성이 풍부한 영역으로 유도하며 데이터 매니폴드에 고정해요.

Diffusion 및 Flow Matching 모델 모두에 적용 가능한 DivIn은 클래스-이미지 및 텍스트-투-이미지 시나리오에서 기존 방식보다 우수한 성능을 보여줘요. 특히 기존 생성 경로 기반 방법과 함께 사용하면 다양성과 품질 모두를 향상시킬 수 있어요.

DivIn은 초기화 단계에서 다양성을 유도하는 방식으로, 기존 방식과 병행하여 사용하면 더욱 효과적이며, 생성 모델의 다양성 확보에 기여할 수 있어요.

##이미네이션##초기화##다양성##생성모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기