Spark3R은 비대칭 토큰 감소 방식을 통해 피드 포워드 3D 재구성 모델의 속도를 향상시키는 프레임워크입니다.
쿼리 토큰은 시점별 기하학적 요청을 인코딩하며 압축에 민감한 반면, 키-값 토큰은 공유된 장면 컨텍스트를 나타내고 적극적인 압축을 견딜 수 있다는 점에 착안했습니다.
VGGT, $π^3$, Depth-Anything-3 등 사전 훈련된 모델에 Spark3R을 적용하여 1,000 프레임 입력에서 최대 28배 속도 향상을 달성했습니다.