연구진은 야외 영상 가상 착용 모델 성능 향상을 위해 1만 개의 트리플 데이터셋인 TripVVT-10K를 새롭게 구축했어요. TripVVT는 Diffusion Transformer 기반 프레임워크로, 기존 모델의 취약한 가먼트 마스크를 단순화하여 배경 보존력을 높였어요. 연구진은 TripVVT-Bench라는 벤치마크를 통해 다양한 환경과 복잡한 시나리오에서 모델 성능을 평가하고, 데이터셋과 벤치마크를 공개했어요.