Pulse · AI 뉴스

Oracle Noise: 텍스트-이미지 정렬을 위한 빠르고 해석 가능한 잠재 최적화

arXiv cs.CV · 2026-04-26

텍스트-이미지 확산 모델에서 복잡한 텍스트 프롬프트를 합성 레이아웃과 정확하게 정렬하는 것은 여전히 어려운 과제예요.

Oracle Noise는 초기 가우시안 노이즈를 의미론적으로 구동되는 최적화로 재구성하는 새로운 프레임워크로, 잠재 변수의 놈 팽창과 시각적 아티팩트를 방지해요.

Oracle Noise는 2초 이내의 제한된 시간 안에 인간 선호도, 의미 정렬, 샘플 다양성 측면에서 최첨단 성능을 달성했어요.

##텍스트이미지##최적화##확산모델##잠재공간##OracleNoise
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기