Pulse · AI 뉴스

FocusDiT: 디퓨전 트랜스포머에서 쿼리 마스킹을 통해 세밀한 이미지 생성

FocusDiT · 2026-06-01

연구진은 디퓨전 트랜스포머(DiT) 모델의 성능 향상을 위해 쿼리 토큰 마스킹 기법인 FocusDiT를 제안했어요.

FocusDiT는 중요한 쿼리 토큰에만 FFN을 적용하여 모델이 복잡한 디테일을 개선하도록 유도하며, FFN은 시각적 의미 지식을 담은 핵심 어휘 역할을 해요.

실험 결과, 쿼리 토큰 마스킹은 세밀한 이미지 생성 성능을 향상시키는 데 효과적이었어요.

##디퓨전##트랜스포머##이미네이션##마스킹##FocusDiT
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기