연구진이 자연어 모델 공격을 위한 하이브리드 유전 알고리즘(GA)인 GAversary를 제안했어요. GAversary는 모델 내부 구조에 대한 접근 없이 로짓 값만 활용해 공격을 생성하며, GloVe 임베딩을 활용해 적대적 예제의 의미적 유사성을 높여요. 실험 결과, GAversary는 기존 공격 기법 대비 모델 정확도를 크게 감소시켰어요.
GAversary는 기존 방식보다 더 많은 단어를 변경하지만, 의미적 유사성이 약간 낮고 실행 시간은 약 5% 증가했어요.