MVP-Nav는 RGB 카메라만으로 작동하는 자율 내비게이션 프레임워크입니다. 3D 기반 모델을 활용해 2D 시맨틱 인스턴스를 3D 바운딩 박스로 변환하여 물리적 상황을 파악합니다. 물리적 제약과 고수준의 의미적 추론을 통합하기 위해 다층 가치 맵(MVM)을 도입하여 안전한 경로 계획을 가능하게 합니다.
기존 RGB 기반 내비게이션 방식은 물리적 불확실성으로 인해 어려움을 겪었지만, MVP-Nav는 3D 기반의 물리적 상황 인지를 통해 성능을 크게 향상시켰습니다. 기존 방식 대비 뛰어난 성능을 보여주며, 물리적 사전 지식이 부재한 상황에서도 효과적임을 입증했습니다.
MVP-Nav는 제로샷 객체 내비게이션 벤치마크에서 기존 방식보다 우수한 성능을 보였습니다. RGB 카메라만으로도 안전하고 효율적인 자율 내비게이션이 가능하다는 것을 보여줍니다.