연구진이 LLM 에이전트의 보안 취약점, 즉 무단 외부 액션과 민감한 텍스트 노출 문제를 해결하기 위해 SecureClaw 아키텍처를 개발했어요.
SecureClaw는 외부 액션 승인과 텍스트 제한을 동시에 적용하여 기존 방식의 한계를 극복하고, 0% 공격 성공률을 달성했어요.
AgentDojo, AgentLeak, Agent Security Bench(ASB) 테스트에서 유용성과 보안성을 모두 입증하며, 최종 출력 및 내부 데이터 유출을 방지했어요.