연구진이 전자상거래 이미지 검색 성능을 높이는 TIGER-FG 프레임워크를 제안했어요. TIGER-FG는 이미지 쿼리와 멀티모달 아이템 간의 모달성 불일치와 세밀성 불일치 문제를 해결합니다.
아이템 텍스트를 활용해 객체 검출 없이 타겟에 집중된 아이템 표현을 생성하며, 1000만 페어 데이터셋으로 구성된 ECom-RF-IMMR 벤치마크에서 강력한 성능을 보였어요.
TIGER-FG는 기존 최적 모델 대비 Recall@1 성능을 각각 6.1%p, 34.4%p 향상시켰으며, 8570만 개의 파라미터와 256차원 임베딩으로 구성돼 있어요.