연구진은 저사양 환경에서 비디오 분석 효율을 높이기 위해 Optimal Stopping Theory(OST) 기반의 FAST-ME 알고리즘을 제안했어요.
FAST-ME는 Vision Transformer(ViT)와 Segment Anything Model(SAM) 등 Foundation Model을 활용해 비디오 프레임 내외의 의미론적 중요도를 파악하고, 이를 SAD와 결합하여 적응적 중단 기준을 설정해요.
실험 결과, FAST-ME는 기존 방식 대비 계산량을 크게 줄이면서도 정확도 손실을 최소화하고 의미론적 커버리지를 향상시키는 것으로 나타났어요.