Pulse · AI 뉴스

제한된 시뮬레이션 훈련 환경에서 규칙 기반 고위험 코칭을 통한 목표 조건 강화 학습

arXiv cs.AI · 2026-04-30

이 논문은 제한된 시뮬레이션 훈련 환경에서 수색 및 구조(SAR) 시나리오에 영감을 받아 무인 항공기(UAV) 임무를 위한 계층적 의사 결정 프레임워크를 제시합니다.

프레임워크는 미리 정의된 규칙 기반의 고위험 자문가와 온라인 목표 조건 강화 학습(RL) 컨트롤러를 결합하며, 엄격한 사전 훈련 없이도 초기 적응력을 테스트합니다.

두 가지 작업에서 제안된 방법은 충돌 종료를 줄여 초기 안전성과 샘플 효율성을 향상시키면서 시나리오별 역학에 온라인으로 적응하는 능력을 유지합니다.

##강화학습##UAV##수색구조##인공지능

매일 핵심 AI 소식을 한국어로, 빠르게