연구진은 비디오 추론 모델이 프레임 신뢰도를 고려하지 않아 발생하는 '맹목적 신뢰 문제'를 제기했어요. Robust-TO는 프레임별 신뢰도를 통합하여 비디오 이해 프레임워크의 정확도를 향상시키는 새로운 접근 방식이에요. 두 가지 비디오 추론 벤치마크에서 Robust-TO는 기존 모델보다 10.6%p 높은 정확도를 달성하고, 현실적인 왜곡 환경에서도 성능 저하를 최소화했어요.