연구진은 반복적인 정제 방어(iterative purification defenses)를 백박스 적대적 공격(white-box adversarial attacks)으로 평가할 때 발생하는 문제점을 분석했어요.
기존에는 메모리 제약으로 인해 근사적인 역전파(approximate backpropagation)를 사용했지만, 이번 연구에서는 체크포인팅(gradient checkpointing)을 활용해 메모리 사용량을 줄이고 정확한 전체 그래디언트(full-gradient) 계산을 가능하게 했어요.
새로운 프레임워크는 기존 평가 방법보다 강력한 공격을 가능하게 하며, 분산 환경에서의 강건성(robustness)을 더욱 정확하게 측정할 수 있도록 돕습니다.