연구진은 4D 메시지 생성 속도를 가속화하고 시계열 대응 품질을 향상시키는 새로운 훈련 없는 접근 방식을 선보였습니다. 핵심 아이디어는 4D 백본 내에서 시계열 대응이 시각적으로 정확한 메시지가 생성되기 전에 나타난다는 점을 활용하는 것입니다. 새로운 프레임워크인 시공간 어텐션 체인은 공간과 시간을 가로질러 정보를 전달합니다.
기존 방식 대비 9초 만에 4D 메시지를 생성하며 13배 빠른 속도를 보여주고, 16배 더 긴 영상에도 메시지 품질 저하 없이 적용 가능합니다. 2D 객체 추적 및 4D 추적과 같은 하위 작업에서 뛰어난 성능을 보입니다.
또한, 시공간 어텐션 체인은 기존 방식에서 지원하지 않던 신뢰할 수 있는 카메라 추정 기능을 가능하게 합니다.