Pulse · AI 뉴스

디퓨전 트랜스포머의 레이어 간 정보 라우팅 재고: DAR 제안

Diffusion Transformers · 2026-05-20

연구진은 디퓨전 트랜스포머(DiT)의 레이어 간 정보 흐름을 분석하여 기존 방식의 문제점(순방향 크기 증가, 역방향 기울기 감소, 블록별 중복)을 발견했어요.

이러한 문제를 해결하기 위해, 시간 간격에 따라 학습 가능한 정보 집계 방식을 적용하는 Diffusion-Adaptive Routing (DAR)을 제안했어요.

DAR은 기존 트랜스포머 개선 방법과 호환되며, ImageNet 데이터셋에서 SiT-XL/2의 FID 점수를 2.11 향상시키고 학습 시간을 8.75배 단축했어요.

연구 결과, 레이어 간 정보 라우팅은 기존 방식과 독립적으로 작동하며, 사전 학습 및 미세 조정 단계에서 고주파 디테일을 보존하는 데 기여하는 중요한 설계 요소로 확인돼요.

##디퓨전모델##트랜스포머##DAR##이미지생성##ImageNet
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기