복합 이미지 검색(CIR)은 다양한 방식의 멀티모달 쿼리를 지원하지만, 노이즈 트리플렛 대응(NTC) 문제로 인해 개발에 어려움을 겪고 있어요.
기존 방법들은 '작은 손실 가정'에 의존하지만, NTC의 의미적 모호함은 이 가정을 무효화하여 신뢰할 수 없는 노이즈 식별을 초래해요.
Air-Know는 외부 전문가의 지식을 활용하여 학습 모델과 평가 모델을 분리하고, 데이터 정렬 스트림과 표현 피드백 조화 스트림을 활용하여 기존 SOTA 방법보다 뛰어난 성능을 보여줬어요.