연구진이 시간적 일관성을 명시적 손실 함수 없이 모델 설계 자체로 내부화하는 새로운 패러다임을 제시했어요.
Chrono-Channel Decomposition (CCD)과 Cross-Temporal Reconstruction (CTR)이라는 두 가지 메커니즘을 도입하여 Slot-Slot Contrastive (SSC) 손실을 제거했어요.
xSSC를 기존 모델에 통합하여 비디오 객체 발견 및 인식 작업에서 새로운 최고 성능(SOTA)을 달성했어요.
연구 결과, 객체의 시간 불변 의미론과 시간 변화 운동학이 제안된 하위 공간에 인코딩됨을 확인했어요.