Pulse · AI 뉴스

모델 기반 자동 공격에 대한 방어적 오도 분석

OpenAI · 2026-06-19

연구진은 에이전트 AI 시스템의 자동화된 공격과 방어 체계를 확률적 모델로 분석했어요.

기존의 악성 상호 작용 탐지 및 차단 방식은 공격 성공률을 높일 수 있다고 밝혔어요.

탐지 후 오도 전략인 CMPE(Contextual Misdirection via Progressive Engagement)를 통해 공격 성공률을 크게 낮출 수 있었어요.

##에이전트AI##보안##CMPE##jailbreak
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기