PolicyGuard는 LLM 에이전트의 정책 준수를 돕는 서브 에이전트 검증기입니다. 기존 안전장치 방식의 한계를 지적하며, 대화 맥락과 정책을 종합적으로 고려하여 에이전트의 다음 단계를 안내합니다.
GPT-5.4, Claude Sonnet 4.6, Gemini 2.5 Pro를 대상으로 한 실험에서 PolicyGuard는 PASS4를 각각 12.0%, 6.0%, 12.0% 향상시켰습니다.
PolicyGuard는 정책 위반을 더 잘 감지하면서도 기존 방식보다 절반 정도만 차단하여 효율성을 높였습니다.