Pulse · AI 뉴스

TrajShield: 텍스트-투-비디오 모델의 안전성 확보를 위한 경로 기반 개입 기술

arXiv cs.CV · 2026-05-03

TrajShield는 텍스트-투-비디오(T2V) 모델의 안전성 확보를 위한 새로운 프레임워크로, 프롬프트의 잠재적 위험을 예측하고 수정하여 안전하지 않은 콘텐츠 생성을 방지합니다.

기존의 프롬프트 기반 방어 기술은 악의적인 재구성을 통해 우회될 수 있지만, TrajShield는 프롬프트의 시간적 경로를 시뮬레이션하여 잠재적 위험의 원인을 찾아 수정합니다.

실험 결과, TrajShield는 기존 방어 기술보다 뛰어난 성능을 보이며, 안전성 확보(ASR 감소 52.44%)와 동시에 의미 충실도를 유지했습니다.

##텍스트투비디오##안전성##인공지능##TrajShield##보안

매일 핵심 AI 소식을 한국어로, 빠르게