연구진은 다중 뷰 3D 평가 시 이미지들이 하나의 정적 3D 장면을 관찰한다는 가정이 틀어질 수 있음을 지적했어요. 기존 평가지표는 정답 데이터를 필요로 하지만, MEt3R과 같은 정답 데이터가 없는 평가지표는 오류 모드가 제대로 파악되지 않은 재구성 백본에 의존해요.
새로운 벤치마크 \benchmark를 통해 신경 재구성 우선순위와 고전적인 기하학적 검증을 비교 분석했고, 백본, 잔차, 집계 구성 요소로 분해되는 파라미터 패밀리를 도입하여 MEt3R보다 최대 3배 더 강력한 변형을 얻었어요.
VGGT, MASt3R, DUSt3R, Fast3R은 관련 없는 장면, 반복 이미지, 무작위 노이즈에 대해 밀집된 기하학적 구조와 교차 뷰 지원을 환각할 수 있으며, COLMAP 기반 지표는 인간 판단과 최대 4배 높은 상관관계를 보여줘요.