연구진이 Qwen3.5-27B를 활용하여 편집 지시사항에 따라 타겟 영상을 검색하는 CoVR-R 파이프라인을 구축했어요. 모델은 각 영상에 대해 구조화된 설명과 밀집 임베딩을 생성하고, 편집 이유를 추론하여 타겟 영상 설명을 생성하여 검색 임베딩으로 활용해요. 밀집 검색과 TF-IDF 기반 텍스트 검색을 결합하여 검증 데이터셋에서 R@1 80.81, R@5 94.86의 성능을 달성했어요.