Pulse · AI 뉴스

MMDiff: 다중 모드 생성을 위한 확산 트랜스포머 확장

MMDiff · 2026-06-15

연구진은 시각적 콘텐츠 생성 후 버려지는 확산 트랜스포머의 시각적 정보를 활용하는 MMDiff 프레임워크를 개발했어요.

MMDiff는 이미지와 함께 다양한 시각적 정보를 동시에 생성하며, 시각적 정보가 노이즈 제거 과정에서 시간적으로 분포되어 있다는 점을 발견했어요.

MMDiff는 기존 DINOv3와 경쟁력 있는 성능을 보이며, 의미론적 분할 정확도를 최대 28.7% 향상시켰고, 가시적인 데이터 생성에도 활용돼요.

##확산모델##다중모드##이미네이션##MMDiff
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기