연구진은 AI 에이전트의 보안 취약점인 명령 거부 목록의 취약성을 측정하는 CmdNeedle 파이프라인을 개발했어요. CmdNeedle는 LLM을 활용해 명령 우회 가능성을 탐색하고, 검증기를 통해 반복적으로 수정하는 방식으로 작동해요. GitHub에서 수집한 1,709개의 명령 거부 목록을 분석한 결과, 69.0~98.6%가 취약한 것으로 나타났어요.