본 연구는 콘트라스트 학습(CL) 모델의 데이터 포이즈닝 공격에 대한 취약점을 평가하고, 이를 데이터 IP 보호를 위한 워터마킹으로 재활용하는 방법을 제시합니다.
기존 데이터 포이즈닝 공격은 데이터 적응성, 성공률, 이식성 측면에서 한계가 있으며, 특정 조건(다운스트림 작업 지식)에 의존한다는 점이 확인되었습니다.
연구진은 데이터 포이즈닝 공격에서 발생하는 트리거 샘플의 통계적 차이를 활용하여 워터마킹 기법을 개발하고, 다양한 수준에서 적용 가능함을 보였습니다.