연구진은 멤버십 추론 공격(MIA)에 대한 강력한 방어 기능을 제공하는 PACZero라는 새로운 프라이버시 강화 미세 조정 기법을 발표했습니다.
PACZero는 서치 제로(Zeroth-order) 방식을 활용하여 후보 집합의 업데이트 방향에 대한 합의를 유도하고, 이를 통해 정보 누출을 최소화합니다.
OPT-1.3B 모델을 사용하여 SST-2 벤치마크에서 88.99%의 정확도를 달성했으며, 이는 비프라이버시 MeZO 기준선에 근접한 수치입니다.