AI 에이전트 보안이 이론적 우려에서 운영상의 위기로 전환된 75일간의 사건들을 정리한 종합 가이드가 공개됐어요.
생산 AI 에이전트의 98%가 민감 데이터 접근, 신뢰할 수 없는 콘텐츠 노출, 외부 액션 기능의 '치명적 삼위일체'를 보이며 보안 기준을 통과하지 못했어요.
Sysdig 공격자는 22초 만에 Cloudflare Workers를 통해 IP 기반 경고를 우회하고 PostgreSQL 데이터베이스를 유출했으며, 중국어 계획 코멘트가 명령 흐름에 노출되기도 했어요.
Anthropic은 자체 구축 레이어가 가장 취약하다고 강조하며, 환경 레이어, 모델 레이어, 외부 콘텐츠 제어의 3단계 방어 모델을 제시했어요.