Pulse · AI 뉴스

누가 피해를 볼까? 실제 웹 에이전트의 이해관계자 중심 프롬프트 인젝션 벤치마킹

StakeBench · 2026-06-11

연구진은 LLM 기반 웹 에이전트의 프롬프트 인젝션 공격 위험을 평가하는 이해관계자 중심 벤치마크 \\\\sysname을 발표했어요.

기존 공격 중심 벤치마크와 달리, \\\\sysname은 공격 성공 여부뿐 아니라 다양한 이해관계자에게 미치는 피해의 비대칭적 영향과 질적 차이를 분석해요.

실험 결과, 현재 웹 에이전트는 단일 공격 목표조차 안정적으로 방어하지 못하며, 은밀한 기생부터 작업 방해, 복합적 실패까지 다양한 방식으로 피해가 발생했어요.

연구진은 벤치마크 코드를 GitHub에 공개하여 실제 웹 에이전트 배포 시 이해관계자 중심의 평가 필요성을 강조했어요.

##프롬프트인젝션##웹에이전트##LLM보안##벤치마크
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기