Pulse · AI 뉴스

연속 POMDP 계획에서 MCTS의 유한 시간 분석

MCTS · 2026-05-08

본 논문은 부분 관측 마르코프 결정 프로세스(POMDP)에서 몬테카를로 트리 검색(MCTS)에 대한 유한 시간 분석을 제시합니다. 이 분석은 이산 및 연속 관측 공간 모두에서 확률적 집중 경계에 대한 정보를 제공합니다.

연속 관측 공간을 위해 추상 파티셔닝 프레임워크를 도입하고 파티셔닝 손실에 대한 유한 시간 경계를 제안하며, Voronoi 셀을 사용하여 연속 관측 공간을 적응적으로 파티셔닝하는 유한 시간 보장을 제공하는 Voro-POMCPOW를 제안합니다.

실험적 검증 결과, 제안된 Voro-POMCPOW는 경쟁력 있는 성능을 보이며 이론적 보장을 제공하는 것으로 나타났으며, 이 기술은 연속 MDP에도 적용 가능합니다.

##MCTS##POMDP##최적화##알고리즘
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기