연구진은 임베딩 기반 검색 모델이 수십억 개의 데이터 포인트에 어떻게 확장될 수 있는지 분석했어요. 연구 결과, 최대 마진을 달성하는 데 필요한 차원은 $d = O(m^{-2} ext{log }n)$ 정도로 기존 연구보다 개선됐어요. InfoNCE와 시그모이드 손실을 비교한 결과, 시그모이드 손실이 더 큰 마진을 가진 임베딩을 생성하는 데 유리했어요.