연구진은 다양한 모드(RGB, RGB+X)를 지원하는 OneTrackerV2라는 통합 시각 추적 프레임워크를 개발했습니다.
OneTrackerV2는 Meta Merger를 통해 다중 모드 정보를 통합 공간에 임베딩하고, Dual Mixture-of-Experts(DMoE)를 사용하여 시공간 관계와 다중 모드 지식을 분리합니다.
OneTrackerV2는 5개의 RGB 및 RGB+X 추적 작업과 12개의 벤치마크에서 최고 성능을 달성했으며, 모델 압축 후에도 강력한 성능을 유지하고 모드 누락 상황에서도 뛰어난 강건성을 보입니다.