연구진이 Fisher 정보 행렬(FIM)의 스펙트럼 노름을 기반으로 공격에 독립적인 모델 강건성 지표를 제안했어요. VGG, ResNet, DenseNet, Transformer 등 다양한 아키텍처에 대한 이론적 강건성 순위를 제시했어요. CIFAR, ImageNet, 의료 영상 등 다양한 데이터셋에서 실험 결과, 제안하는 지표와 적대적 취약점 간의 강한 상관관계가 확인됐어요.
연구진은 power iteration, Hutchinson 기반 추정 등 효율적인 알고리즘을 개발해 백박스, 블랙박스 환경에서 확장 가능한 평가를 지원해요. 제안하는 프레임워크는 공격 기반 평가를 보완하는 해석 가능한 진단 도구로 활용될 수 있어요.
GitHub에서 관련 코드 확인할 수 있어요: https://github.com/franz-chang/SRP/