연구진은 시각 객체 추적(VOT)의 일반화 성능을 높이기 위해 SAM 2를 기반으로 하는 새로운 프레임워크 SAMOSA를 제안했어요. SAMOSA는 대상의 움직임, 기하학적 구조, 의미적 단서를 활용하여 비선형 움직임, 가려짐, 교란 요소가 많은 복잡한 시나리오에서 추적 성능을 개선해요. 실험 결과, SAMOSA는 기존 SAM 2 기반 방법보다 뛰어난 성능을 보였으며, 일반적인 벤치마크에서 우수한 일반화 능력을 입증했어요.