연구진이 AI 에이전트 안전·보안을 위한 경량화된 정렬 프레임워크 AgentDoG 1.5를 제안했어요. Codex 및 OpenClaw 실행 시나리오에서 발생하는 새로운 위험을 수용하도록 안전 분류 체계를 업데이트했어요.
AgentDoG 1.5는 1,000개 샘플만으로 학습하여 GPT-5.4와 유사한 성능을 달성했으며, 0.8B~8B 파라미터의 다양한 크기로 제공돼요.
AgentDoG 1.5는 Docker 환경에서 배포 오버헤드를 2배 줄이는 효율적인 에이전트 안전 SFT 및 RL 훈련 환경을 구축하고, 실시간 안전 관리를 위한 온라인 가드레일로도 활용돼요.