텍스트-이미지 확산 모델에서 복잡한 텍스트 프롬프트를 합성 레이아웃과 정확하게 정렬하는 것은 여전히 어려운 과제예요. Oracle Noise는 초기 가우시안 노이즈를 의미론적으로 구동되는 최적화로 재구성하는 새로운 프레임워크로, 잠재 변수의 놈 팽창과 시각적 아티팩트를 방지해요. Oracle Noise는 2초 이내의 제한된 시간 안에 인간 선호도, 의미 정렬, 샘플 다양성 측면에서 최첨단 성능을 달성했어요.