Safe-RULE은 오프라인 안전 강화 학습(Safe RL) 환경에서 데이터 포이즈닝 공격에 대한 방어 프레임워크입니다. 악의적인 샘플의 영향을 제거하면서 처음부터 다시 학습하거나 환경에 접근할 필요가 없습니다. Safe-RULE은 작업 성능과 안전 제약 조건을 모두 고려하여 강화 학습을 제거합니다.
데이터 포이즈닝 공격에 대한 안전 성능을 향상시키는 효과를 검증했습니다. 기존 Safe RL의 한계를 극복하고 안전성을 강화하는 데 기여합니다. 새로운 학습 패러다임을 제시하여 안전 강화 학습의 신뢰성을 높입니다.