연구진이 이미지 검색과 자세 추정 작업을 융합한 통합 프레임워크 CIPER(Cross-view Image-retrieval and Pose-estimation transformER)를 제안했어요.
CIPER는 시티 규모의 이미지 검색과 정밀 3-DoF 자세 추정을 동시에 수행하며, 기존 방법의 오류 전파 및 불일치한 특징 표현 문제를 해결해요.
VIGOR, KITTI, Ford Multi-AV 데이터셋 실험 결과, 제한된 시야각 및 임의 방향 조건에서 경쟁력 있는 성능을 보여줬고, GitHub에서 코드 확인할 수 있어요.