Pulse · AI 뉴스

위험 인식 강화 학습에서 확률적 안전 보장 기반 시나리오 생성

arXiv cs.AI · 2026-06-03

연구진은 강화 학습(RL) 에이전트의 안전한 배포를 위해 안전 보장 기술을 개발했어요.

정책 검증을 위해 안전 제약 조건에 대한 정책 경로를 샘플링하여 안전 영역과 안전하지 않은 영역을 구분하는 확률적 장벽 인증서를 생성해요.

연구진은 VAE를 사용하여 상태 공간 분포를 근사하고, 상태의 잠재적 특성을 사용하여 상한 및 하한 장벽 인증서를 구성하여 안전 영역을 최적화했어요.

##강화학습##안전##VAE##보장

매일 핵심 AI 소식을 한국어로, 빠르게