연구진은 합성 데이터 생성기(SDG)에 대한 멤버십 추론 공격(MIA) 위험을 평가하는 새로운 프라이버시 메트릭인 ReMIA를 소개했어요. ReMIA는 기존 MIA보다 훨씬 실용적이며, 단 두 번의 SDG 훈련만으로 가능해요.
ReMIA는 두 개의 소스 데이터셋에서 합성 데이터셋을 생성하고, 분류기가 어떤 소스에서 왔는지 식별할 수 있는지 측정하는 방식으로 작동하며, 기존 MIA와 유사한 감도를 보여줘요.
연구 결과, SDG는 전통적인 노이즈 기반 익명화 방법보다 더 나은 프라이버시-유용성 균형을 달성할 수 있는 것으로 나타났으며, 관련 코드는 GitHub에서 확인할 수 있어요.