연구진은 환경의 기하학적 및 의미 구조를 이해하는 것이 임베디드 내비게이션과 추론에 필수적이라고 보고, 다중 스케일 가우시안-언어 지도(GLMap)를 제안했습니다.
GLMap은 명시적 기하학, 다중 스케일 의미(인스턴스 및 영역 개념 포함), 자연어 설명과 3D 가우시안 표현을 결합한 이중 모드 인터페이스를 특징으로 합니다.
ObjectNav, InstNav, SQA 작업에서 GLMap은 목표 내비게이션과 문맥 추론을 향상시키며, 대규모 모델 기반 방법과 호환성을 유지하는 것으로 나타났습니다.