MUSE는 기존 디퓨전 모델의 타임스텝 임베딩을 활용해 단일 모델로 여러 작업을 수행하는 새로운 접근 방식입니다. 별도의 파라미터 없이 타스크별 생성 과정을 분리하여 성능을 높입니다. 단안 깊이 추정 및 노멀 추정 작업에서 경쟁력 있는 성능을 보여주며, U-Net 및 DiT 아키텍처 모두에 적용 가능합니다.
MUSE는 타임스텝 값을 활용하여 생성 과정을 분리하고, 각 작업에 맞는 공간에 위치시키는 '매니폴드 분리' 메커니즘을 활용합니다. 이 방식은 기존 방식의 복잡성을 줄이고 효율성을 높입니다.
연구 결과, MUSE는 기존 디퓨전 모델의 잠재력을 활용하여 범용적인 비전 모델 개발에 기여할 수 있는 간결하고 효율적인 방법을 제시합니다.