Pulse · AI 뉴스

Safe-RULE: 안전한 강화 학습 데이터 제거 기법

Safe-RULE · 2026-06-08

Safe-RULE은 오프라인 안전 강화 학습(Safe RL) 환경에서 데이터 포이즈닝 공격에 대한 방어 프레임워크입니다. 악의적인 샘플의 영향을 제거하면서 처음부터 다시 학습하거나 환경에 접근할 필요가 없습니다. Safe-RULE은 작업 성능과 안전 제약 조건을 모두 고려하여 강화 학습을 제거합니다.

데이터 포이즈닝 공격에 대한 안전 성능을 향상시키는 효과를 검증했습니다. 기존 Safe RL의 한계를 극복하고 안전성을 강화하는 데 기여합니다. 새로운 학습 패러다임을 제시하여 안전 강화 학습의 신뢰성을 높입니다.

##안전강화학습##데이터포이즈닝##오프라인학습##SafeRL##Unlearning
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기