SEGA는 디퓨전 트랜스포머(DiT)의 해상도 확장 성능을 향상시키는 새로운 방법입니다. 기존 방식의 단점을 보완하기 위해, DiT가 노이즈 제거 단계마다 잠재적 구조에 따라 어텐션 스케일링을 동적으로 조절합니다. SEGA는 구조적 일관성과 미세한 디테일 재현력을 모두 개선하여, 다양한 목표 해상도에서 기존 방식보다 뛰어난 성능을 보입니다. 이 방법은 학습 과정 없이 적용 가능하며, DiT의 고해상도 합성을 개선하는 데 효과적입니다.