TrajShield는 텍스트-투-비디오(T2V) 모델의 안전성 확보를 위한 새로운 프레임워크로, 프롬프트의 잠재적 위험을 예측하고 수정하여 안전하지 않은 콘텐츠 생성을 방지합니다.
기존의 프롬프트 기반 방어 기술은 악의적인 재구성을 통해 우회될 수 있지만, TrajShield는 프롬프트의 시간적 경로를 시뮬레이션하여 잠재적 위험의 원인을 찾아 수정합니다.
실험 결과, TrajShield는 기존 방어 기술보다 뛰어난 성능을 보이며, 안전성 확보(ASR 감소 52.44%)와 동시에 의미 충실도를 유지했습니다.