연구진은 텍스트-이미지 생성 모델의 다중 개념 커스터마이징 문제를 해결하기 위해 LoRA 모듈 출력을 최적 조합하는 새로운 방법을 제안했어요.
W-Switch와 W-Composite라는 두 가지 방법은 프롬프트 토큰에서 추론된 각 개념의 상대적 중요도를 활용하여 프롬프트에 따라 LoRA를 가중치 적용해요.
새로운 이미지 기반 유사성 평가 프레임워크를 통해 이미지 충실도와 개별 개념 영역 보존을 평가하고, ComposLoRA 테스트베드에서 기존 방법보다 시각적 품질, 개별성 보존, 조형성 측면에서 개선된 결과를 확인했어요.