본 논문은 동영상 액션 감지 시 시점 변화에 대한 불변성과 시간적 일관성을 개선하는 새로운 2단계 접근 방식을 제안합니다. 첫 번째 단계에서는 가상 시점에서 추출한 운동 특징을 활용하고, 두 번째 단계에서는 시점 불변적이고 다중 스케일의 시간적 인코더를 도입합니다. PKU-MMD 및 BABEL 벤치마크 실험 결과, 기존 방식보다 성능이 향상된 것을 확인했습니다.