LLM이 도구, 데이터베이스, 외부 서비스에 접근하는 자율 에이전트로 점점 더 많이 배포되고 있지만, 특정 에이전트 배포 내에서 알려진 위협 유형이 구체적인 위험으로 어떻게 변환되는지 체계적으로 평가할 수 있는 방법은 부족합니다.
연구진은 자산 기반 영향 평가를 시작하고 공격 트리를 사용하여 시스템 아키텍처 내에서 이러한 영향이 발생할 가능성을 결정하는 실용적인 위협 모델링 프레임워크 MATRA를 제시합니다.
OpenClaw를 사용하는 개인 AI 에이전트 배포를 통해 MATRA를 시연하여 네트워크 샌드박싱 및 최소 권한 액세스와 같은 아키텍처 제어가 성공적인 주입의 폭을 제한하여 위험을 줄이는 방식을 정량화했습니다.