연구진은 모노 뎁스 추정 모델의 성능을 평가하는 새로운 프레임워크 Depth2Pose를 제안했습니다. 기존 벤치마크는 뎁스 정확도를 평가하는 데 집중했지만, Depth2Pose는 SfM, 시각적 로컬라이제이션, SLAM과 같은 다운스트림 작업에 유용하도록 설계되었습니다.
Depth2Pose는 뎁스 예측과 깊이 인식 기하학적 솔버의 특징 대응을 결합하여 카메라 포즈 추정 정확도를 통해 뎁스 품질을 평가합니다. 기존 벤치마크와 달리, 카메라 포즈만 있으면 되므로 대규모 장면이나 가려움이 심한 환경에서도 적용 가능합니다.
연구진은 Depth2Pose를 활용하여 기존 벤치마크에서 좋은 성능을 보이는 모델도 새로운 데이터셋에서는 일반화되지 않는다는 것을 보여주었으며, 간단하고 확장 가능한 평가 프레임워크를 제공합니다.