Pulse · AI 뉴스

텍스트-이미지 확산 모델, 핵심 토큰 어텐션 기반 시드 선택으로 성능 향상

Stable Diffusion · 2026-05-19

연구진은 텍스트-이미지 확산 모델의 이미지 품질과 프롬프트-이미지 정합성에 큰 영향을 미치는 '시드 효과'를 재조명했어요. 핵심 단어에 대한 어텐션 역학이 생성 품질을 예측한다는 사실을 발견했어요. 이를 바탕으로, 훈련 없이도 적용 가능한 Attention-Based Seed Selection(ABSS) 기법을 제안했어요.

ABSS는 디노이징 과정에서 핵심 토큰에 대한 교차 어텐션을 활용해 시드를 순위화하며, 상위 k개 시드만 선택해 이미지를 생성해요. 기존 시드 최적화 파이프라인에 가볍게 추가하여 성능 향상을 기대할 수 있어요. Stable Diffusion 모델에서 인간 선호도 및 정합성 지표를 통해 효과를 입증했어요.

ABSS는 추론 과정에서만 작동하며, 초기 노이즈를 변경하지 않고, 고정된 수용/거부 임계값에 의존하지 않아요.

##텍스트투이미지##확산모델##시드최적화##어텐션##StableDiffusion
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기