연구진은 장면 텍스트 편집 성능 향상을 위한 데이터 구축 파이프라인과 평가 벤치마크인 TextSculptor를 공개했어요.
TextSculpt-Data는 320만 개의 훈련 샘플을 포함하며, 120만 개는 OCR 검증된 텍스트-이미지 샘플, 200만 개는 자연스럽게 정렬된 소스-타겟 이미지와 배경 일관성을 가진 텍스트 편집 샘플이에요.
TextSculpt-Bench는 텍스트 추가, 교체, 제거, 하이브리드 편집 등 4가지 핵심 텍스트 편집 작업을 다루며, OCR 기반 텍스트 정렬, 다중 모드 판단, 배경 영역 유사성으로 평가해요.
TextSculptor를 통해 오픈 소스 텍스트 편집 성능이 향상되었고, 독점 모델과의 격차가 줄어들었으며, 데이터와 벤치마크는 GitHub에서 공개됐어요.