연구진이 온라인 마켓플레이스 상품 이미지 생성 시 소비자 수요를 반영하는 'utility-aware multimodal contrastive learning' 프레임워크를 개발했어요.
새로운 프레임워크는 Utility-Aware InfoNCE 손실 함수를 활용해 이미지와 텍스트의 의미적 일관성을 유지하면서도 수요를 높이는 이미지를 생성하도록 유도해요.
Amazon과 Airbnb 데이터셋 실험 결과, 기존 모델보다 수요 증가 및 충실도 유지에 효과적이었으며, 인간 평가 실험에서도 상업적 효능을 입증했어요.
개발된 프레임워크는 기존 생성 AI 모델에 유연하게 통합될 수 있어 상업적 활용 가능성이 높아요.