연구진이 지속적 학습(Continual Learning)과 데이터 삭제(Machine Unlearning)의 이중성을 활용한 PURGE 알고리즘을 제안했어요. PURGE는 기존 모델의 숨겨진 표현에서 정보를 제거하고, 데이터 삭제 시에도 유출 위험을 줄이는 기술이에요. 실험 결과, PURGE는 96% 이상의 유지 정확도를 유지하며, 개인 정보 추론 공격(MIA)에 대한 방어 성능도 뛰어났어요.
PURGE는 데이터 삭제 과정에서 모델의 자연스러운 혼동 패턴을 목표로 삼아, 삭제 전 모델과 삭제 후 모델을 구별하기 어렵게 만들어요. 또한, 유지 손실 예산과 망각 정확도 목표라는 자체 규제 중단 기준을 통해 수동 튜닝 없이 삭제 단계를 결정할 수 있어요.
CIFAR-10, MNIST, SVHN, STL10, PathMNIST 등 5개 데이터셋에서 22개의 클래스 단위 망각 작업을 수행한 결과, PURGE는 기존 방식보다 프라이버시-유틸리티 균형을 효과적으로 달성했어요.