연구진이 텍스트-이미지 생성 모델의 시공간적 적응형 보상 할당(STAR) 기법을 제안했어요. 기존 방식의 세분화되지 않은 업데이트 문제를 해결하기 위해 개발됐어요.
STAR는 텍스트-이미지 어텐션과 핵심 프롬프트 콘텐츠를 활용해, 디노이징 단계와 롤아웃에 따라 동적으로 변하는 공간 할당 맵을 구축해요.
Stable Diffusion 3.5 Medium 모델을 기반으로 GenEval, OCR 텍스트 렌더링, PickScore에서 각각 0.9759, 0.9757, 23.60의 성능을 달성하며, 기존 방식 대비 성능 향상을 입증했어요.