본 연구는 밀집 광학류 추정 정확도를 높이기 위해 테스트 시간 연산 스케일링이 유일한 방법이 아니라고 주장하며, 사전 학습된 모델의 시각적 의미론적, 기하학적 사전 지식을 활용하는 새로운 프레임워크를 제시합니다.
DINO-v2 백본에서 시각적 의미론적 특징을 추출하고 단안 깊이 모델의 기하학적 단서를 결합하여 단일 패스 방식으로 밀집 광학류를 추정하며, 반복적인 개선 과정과 추가적인 추론 시간 연산을 피합니다.
Sintel Final 벤치마크에서 2.81 EPE를 달성하며, 동일한 조건에서 기존 SOTA 모델인 SEA-RAFT를 능가하고 RAFT, GMFlow, FlowSeek를 능가하는 성능을 보여줍니다.