대규모 시각 언어 모델(LVLM)이 웹 규모 데이터로 학습하면서 저작권 콘텐츠를 기억하고 재생성하는 문제가 발생하고 있습니다. 기계 학습 삭제는 이러한 위험을 완화하는 방법이지만, 복잡한 다중 모드 환경에서 효과를 평가하는 것은 어려운 과제입니다.
연구진은 저작권 콘텐츠 삭제를 평가하는 첫 번째 프레임워크인 CoVUBench를 소개했습니다. CoVUBench는 절차적으로 생성된 합성 데이터를 활용하여 실제적인 평가를 보장합니다.
CoVUBench는 저작권 보유자의 관점에서 삭제 효과를 측정하고, 배포자의 관점에서 모델의 일반적인 유용성을 보존하는 중요한 균형을 평가합니다.