본 논문은 연합 학습(FL) 환경에서 LLM 모델을 미세 조정할 때, 워터마크 검출을 통해 어떤 사용자가 워터마크가 포함된 데이터를 사용했는지 추적하는 기술인 'FedAttr'을 제안합니다.
FedAttr은 안전한 집계(SA)를 통해 개인정보 보호를 유지하면서, 페어드-서브셋-차분(paired-subset-difference) 메커니즘을 사용하여 각 사용자의 업데이트를 추정하고 워터마크 검출기를 통해 점수를 매깁니다.
실험 결과, FedAttr은 기존 방법보다 정확도가 44.4% 이상 향상되었으며, FL 학습 시간 대비 오버헤드는 6.3%에 불과하여 높은 성능을 보였습니다.