Tango3D는 2D 픽셀과 3D 포인트 간의 정밀한 대응 관계와 전역 검색을 동시에 지원하는 새로운 모델이에요.
기존 3D 모델은 3D 형상을 전역 벡터로 압축하는 데 집중했지만, Tango3D는 geometry-aware 2D 비전 백본과 3D VAE를 활용해 2D 패치와 3D 토큰을 공유 공간에 매핑해요.
Tango3D는 세 단계의 점진적 학습 전략을 통해 밀집 대응과 전역 목표를 안정적으로 학습하며, 다양한 3D 다운스트림 작업에 활용될 수 있어요.