연구진이 텍스트 지시와 시각적 프롬프트를 결합한 새로운 이미지 편집 기술 'TV-Edit'을 개발했어요. TV-Edit은 텍스트 지시의 의미 전달력과 시각적 프롬프트의 정밀한 공간 제어력을 융합하여 이미지 조작의 정확성과 의도 충실도를 높였어요. 23,000개 이상의 샘플로 구성된 텍스트·이미지 지시 데이터셋과 TV-Edit-Bench 벤치마크를 공개하여 기술의 성능을 검증했어요.