PKS⁴는 2D 비전 백본을 유지하면서 선형 복잡도의 시간 스캔을 삽입하여 비디오 이해의 시간 모델링 문제를 해결하는 새로운 방법이에요. 운동 우선 정보를 활용하여 SSM을 구동하고, 시간 차원을 따라 병렬 스캐너를 배치하여 공간 구조를 보존하면서 오버헤드를 줄여요. 실험 결과, PKS⁴는 기존 비디오 SSM보다 10배 낮은 컴퓨팅 비용으로 수렴하며, 액션 인식 벤치마크에서 최고 성능을 달성했어요.