연구진은 자율 LLM 에이전트의 보안 취약점을 평가하기 위한 프레임워크 SeClaw를 공개했어요. SeClaw는 규격 기반 보안 작업 합성 방식과 실행 기반 보안 평가 방식을 결합합니다.
SeClaw는 구조화된 위험 규격을 기반으로 보안 작업을 확장 가능하고 제어 가능하게 생성하며, 다양한 안전 위험 시나리오에서 에이전트의 행동을 평가할 수 있는 표준 테스트베드를 제공합니다.
자율 LLM 에이전트의 보안 실패를 측정, 진단, 비교하기 위한 실용적인 기반을 제공하며, GitHub에서 코드 확인할 수 있어요.