UniCustom은 다중 참조 이미지 생성 시 참조 이미지의 세부적인 외형을 보존하는 데 어려움을 겪는 기존 모델의 문제를 해결하기 위한 프레임워크입니다. ViT와 VAE 특징을 VLM 인코딩 전에 융합하여 모델이 의미 기반의 주제와 해당 시각적 외형을 함께 인코딩하도록 합니다. 실험 결과, UniCustom은 기존 모델 대비 주제 일관성, 지시사항 준수, 합성 충실도를 향상시키는 것으로 나타났습니다.