연구진은 CLIP 백도어 공격이 다양한 배포 인터페이스를 통해 어떻게 노출되는지 분석하는 DIFE 프레임워크를 개발했어요. DIFE는 각 인터페이스의 구성 요소, 트리거 채널, 목표 이벤트 등을 명시하여 다양한 평가를 비교 가능하게 해요. DIFE는 CLIP 백도어 공격이 특정 구성 요소의 발자국을 따라 전파되며, 텍스트 측 독성화는 텍스트 인코더 제어를 가져오지 않는다는 점을 밝혀냈어요.