연구진이 소량의 이미지-텍스트 데이터만으로도 효과적인 이미지-텍스트 검색을 가능하게 하는 GNAH(Global-Neighborhood Alignment Hashing) 방식을 제안했어요. GNAH는 기존 방식의 대규모 데이터 의존성을 줄이고, 이미지와 텍스트의 의미 구조를 보존하는 데 집중했어요.
GNAH는 Prototype-Anchored Global Alignment 모듈을 통해 연속적인 잠재 공간의 구조적 정보를 이진 해밍 공간으로 옮기고, Contrastive Stochastic Neighborhood Alignment 모듈로 이웃 관계를 모델링하여 과적합을 방지해요.
실험 결과, GNAH는 데이터가 부족한 환경에서 기존의 비지도 CMH 방법보다 뛰어난 성능을 보이며, 실제 이미지-텍스트 검색 응용 분야에 유용한 솔루션을 제공해요.