연구진이 페르소나 보존 텍스트-비디오 생성 프레임워크 ST-DRC를 제안했어요. ST-DRC는 참조 이미지 정보를 비디오 VAE에 주입하고, 시공간적 어텐션으로 페르소나 정보를 흐르게 해요.
TASS-RoPE를 도입하여 참조 정보가 시공간적으로 흐르도록 하고, 색상·자세·레이아웃 변화에도 페르소나를 보존하도록 유도해요.
ST-DRC는 LTX-2.3 기반으로 설계되었으며, 페르소나 보존 비디오 생성 트랙에서 상위권 성적을 거둬 유효성을 입증했어요.