대규모 생성 모델의 학습 데이터 암기 경향 때문에 샘플 검증이 개인 정보 감사 및 저작권 집행에 중요해요. 기존 멤버십(MIA) 공격은 한 번의 생성에 의존하지만, 신호가 약하고 다양한 양식에 대한 민감도가 제한적이에요. MADreMIA는 화이트박스, 그레이박스, 블랙박스 MIA 및 DI를 향상시키는 모델에 구애받지 않는 프레임워크를 도입했어요.
학습된 멤버 샘플은 비멤버 생성보다 반복 회생 과정에서 일관성이 높고 성능 저하가 느린 것을 확인했어요. 다양한 모델 패밀리 및 양식에서 풍부한 신호를 제공하며, IAR, 확산, 언어 모델에 대한 종합적인 평가를 보여주고 오디오 모델에 대한 잠재력도 확인했어요.
MADreMIA는 섀도 모델 훈련을 대체하여 대규모 생성 모델에 적합한 확장 가능한 추론을 가능하게 해요.