Pulse · AI 뉴스

안전이 중요한 상황에서의 온라인 리만 최적화를 이용한 문맥 기반 제어

arXiv cs.AI · 2026-04-22

연구진은 복잡해지는 현대 세계 모델을 고려하여, Planner가 블랙박스 시뮬레이터의 제약 조건 하에서 문맥 신호에 따라 작업 목표를 최적화하는 안전이 중요한 문맥 기반 제어 문제를 연구했어요.

온라인 리만 최적화에 기반한 Penalized Predictive Control (PPC) 프레임워크를 개발하여 시뮬레이터가 가능성 다양체를 점수 기반 밀도로 압축하고, 이를 통해 Planner의 경사 하강을 안내하는 리만 기하학을 구축했어요.

실험 결과, 문맥 기반 PPC는 환경 변화 후에도 기존 모델보다 성능이 뛰어나며, 문맥 정보가 풍부할수록 장점이 커지는 것을 확인했어요.

##리만최적화##문맥학습##강화학습

매일 핵심 AI 소식을 한국어로, 빠르게