연구진은 LLM 에이전트의 새로운 공격 경로인 다단계 트로이 목마 공격을 분석하고, 이를 탐지하기 위한 벤치마크 ClawTrojan을 공개했어요.
ClawTrojan은 GPT-5.4 환경에서 95.5%의 높은 공격 성공률을 기록하며, 기존 단일 단계 프롬프트 인젝션 공격은 거의 탐지되지 않는다는 것을 보여줬어요.
DASGuard는 악성 콘텐츠의 출처를 추적하고, 신뢰할 수 없는 콘텐츠를 제거하여 에이전트 활용 환경을 보호하는 새로운 방어 기법으로, 런타임 공격 차단과 함께 안전한 워크스페이스 관리를 제공해요.