SteeringDiffusion은 디퓨전 모델의 콘텐츠와 스타일 간 균형을 조절하는 새로운 인터페이스입니다. 이 방법은 U-Net 구조를 고정하고 작은 잠재 코드를 학습하여 FiLM/AdaGN 스타일의 변조 파라미터로 투영합니다.
SteeringDiffusion은 기존 모델과 동일한 성능을 유지하면서도 콘텐츠와 스타일 간의 부드럽고 일관된 변화를 제공하며, LoRA보다 우수한 제어력과 안정성을 보입니다.
연구진은 S-BEC(Steering Bottlenecked Explicit Control)를 실용적인 제어 인터페이스로 제시하며, DDIM 역방향을 이용한 진단 도구를 통해 제어 효과를 분석했습니다.