Pulse · AI 뉴스

LLM 에이전트 스킬 인젝션 공격 방어 및 활성화 전략

arXiv cs.CL · 2026-06-01

LLM 에이전트가 재사용 가능한 스킬에 의존하면서 새로운 공격 표면이 발생했어요. 연구팀은 스킬 파일 접근을 중재하는 동적 가디언과 스킬 파일을 미리 수정하는 정적 가디언 등 가디언 기반 방어 기법을 평가했어요. 세 가지 LLM 에이전트 패밀리에서 가디언은 공격 성공률을 절반 이상 줄이면서 작업 유용성을 유지했어요.

연구팀은 공격 재구성 공격을 통해 가디언의 성능을 테스트했는데, 악성 명령어를 유지하면서 표현 방식을 변경하는 4가지 공격을 사용했어요. 가디언이 없는 환경에서 공격 재구성은 공격 성공률을 81.4%까지 끌어올렸지만, 동적 가디언은 이를 18.6%로 낮춰 실시간 중재의 강력한 방어 효과를 입증했어요.

이번 연구는 LLM 에이전트의 스킬 인젝션 공격 방어를 위한 새로운 접근 방식을 제시하며, 실시간 중재의 중요성을 강조합니다.

##LLM##에이전트##보안##인젝션##가디언
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기