Pulse · AI 뉴스

TextGround4M: 프롬프트 기반 레이아웃 인지 텍스트 렌더링을 위한 데이터셋

TextGround4M · 2026-04-27

연구진은 텍스트-이미지 생성 모델이 프롬프트에 명시된 텍스트를 정확하게 렌더링하는 데 어려움을 겪는다는 문제점을 발견했어요.

TextGround4M은 4백만 개 이상의 프롬프트-이미지 쌍으로 구성된 대규모 데이터셋으로, 각 이미지에는 프롬프트에 기반한 스팬 레벨 텍스트와 경계 상자가 주석으로 달려 있어요.

TextGround4M을 활용한 훈련 전략은 텍스트 충실도, 공간 정확도, 프롬프트 일관성을 향상시키는 효과를 보여주며, 프롬프트 기반 텍스트 렌더링에 있어 정밀한 레이아웃 감독의 중요성을 강조해요.

##데이터셋##텍스트-이미지##레이아웃##TextGround4M
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기