GeoMix는 디스크립터 없이 시각적 위치를 추정하는 새로운 프레임워크입니다. 기존 방식의 한계를 극복하기 위해 로컬 기하학적 구조를 강화하고, 글로벌 맥락을 활용하며, 멀티 디텍터 훈련을 도입했습니다.
로컬에서는 방향과 거리 정보를 활용한 임베딩으로 주변 구조를 세밀하게 반영하고, 글로벌에서는 크로스 어텐션을 통해 장면 전체의 정보를 활용합니다.
MegaDepth, Cambridge Landmarks 등 다양한 데이터셋에서 기존 디스크립터 없는 방식보다 89% 더 높은 회전 정확도를 달성하며, 디스크립터 기반 방식과의 격차를 좁혔습니다.
GeoMix 코드는 GitHub에서 확인할 수 있습니다.