연구진은 제한된 시점 정보만으로 공간 추론을 하는 기존 방식의 한계를 지적했어요. Reason, then Re-reason (ReRe) 프레임워크는 공간 가설을 검증하거나 수정하기 위해 새로운 시점 영상을 활용하는 방식이에요. Geometry-to-Video 파이프라인을 통해 전략적으로 보완적인 새로운 시점을 생성하여 MLLM의 성능을 향상시켰어요.
VSI-Bench와 STI-Bench에서 ReRe는 오픈소스 MLLM의 성능을 최고 수준으로 끌어올렸어요. 프로젝트 페이지는 GitHub에 공개되어 있어요.
ReRe는 학습 과정 없이 추론 시점에 적용 가능한 프레임워크로, 공간 가설을 처음에는 세우고, 이후 새로운 시점 영상을 통해 검증하거나 수정하는 방식으로 작동해요.