연구진은 비디오 인스턴스 분할(VIS) 훈련에 필요한 고비용의 밀집 어노테이션 문제를 해결하기 위해 SA-VIS를 제안했어요. SA-VIS는 Past-frames Feature Propagation (PFP) 모듈을 통해 희소 프레임 레이블만으로도 효과적인 학습이 가능하도록 설계됐어요. SA-VIS는 기존 방식 대비 성능을 향상시키고, 희소 어노테이션 환경에서 최고 성능 모델과의 격차를 0.4% 이내로 줄이는 데 성공했어요.