연구진이 Segment Anything (SAM) 모델을 활용한 새로운 추적 프레임워크 SAMOSA를 제안했어요. SAMOSA는 동작, 기하, 의미 단서를 활용하여 복잡한 시각 객체 추적 시나리오에 적응하도록 설계됐어요.
SAMOSA는 대상의 동작을 모델링하고 마스크 선택을 안내하는 경량 비선형 동작 예측기를 도입하고, 추적 실패 시 복구를 위해 의미 단서를 활용해요.
기하 단서는 구조적 제약으로 통합되어 추적 안정성을 향상시키며, 기존 SAM 2 기반 방식보다 성능이 우수하고 일반화 능력이 뛰어나요.
연구 결과, SAMOSA는 일반 벤치마크에서 최고 성능을 달성하고, 복합 비선형 동작 시나리오인 anti-UAV 데이터셋에서도 상당한 성능 향상을 보였어요.