Pulse · AI 뉴스

자연어 분류기 모델의 진화적 생성 적대적 텍스트 취약점 분석

GAversary · 2026-06-26

연구진이 자연어 모델 공격을 위한 하이브리드 유전 알고리즘(GA)인 GAversary를 제안했어요. GAversary는 모델 내부 구조에 대한 접근 없이 로짓 값만 활용해 공격을 생성하며, GloVe 임베딩을 활용해 적대적 예제의 의미적 유사성을 높여요. 실험 결과, GAversary는 기존 공격 기법 대비 모델 정확도를 크게 감소시켰어요.

GAversary는 기존 방식보다 더 많은 단어를 변경하지만, 의미적 유사성이 약간 낮고 실행 시간은 약 5% 증가했어요.

##NLP##적대적공격##유전알고리즘##GAversary
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기