SUNTA는 계층적 상태 공간 모델(HSSM)의 예측 오류를 활용해 비디오 예측의 시간적 구조를 개선하는 방법이에요. 기존 방식의 고정 길이 또는 유사성 기반 청킹 방식의 한계를 극복하고, 예측 오류를 기반으로 청크 경계를 결정해 250 timestep까지 정확한 예측을 유지해요. 분리된 학습 전략을 통해 예측 신호를 보존하고, 내부 불일치를 활용해 청크 경계를 결정하는 방식으로, 기존 방식보다 뛰어난 성능을 보여요.