연구진은 AI 레드 팀 운영을 자동화하는 에이전트를 개발하여, 기존 방식의 수 주간 작업 시간을 몇 시간으로 단축했습니다. 새로운 에이전트는 45개 이상의 공격, 450개 이상의 변환, 130개 이상의 평가 도구를 기반으로 다양한 AI 시스템을 탐색할 수 있습니다. Meta Llama Scout 레드 팀 테스트에서 85%의 공격 성공률을 기록했으며, 이는 인간이 개발한 코드 없이 달성한 결과입니다.