Pulse · AI 뉴스

텍스트-이미지 생성의 창의성 향상을 위한 자기 창작 방식 연구

SCDiff · 2026-05-19

연구진은 텍스트-이미지 생성 모델의 창의성 부족 문제를 해결하기 위해 자기 창작 확산(SCDiff) 모델을 제안했어요. 이 모델은 학습 가능한 공간 가중치(LSW) 모듈과 시각-의미 혼합 손실(VSML) 모듈을 핵심으로 합니다.

LSW 모듈은 중앙 이미지 특징을 강화하여 새롭고 놀라운 이미지를 생성하고, VSML 모듈은 의미적 일관성을 유지하면서도 원본 이미지와 차별성을 확보하여 시각적 참신성을 높여요.

실험 결과, SCDiff 모델은 창의성, 의미적 정렬, 시각적 일관성을 크게 향상시켜 창의적인 객체 생성을 위한 강력한 프레임워크를 제공하는 것으로 나타났어요.

##텍스트이미지##창의성##확산모델##SCDiff##AI생성

매일 핵심 AI 소식을 한국어로, 빠르게