Pulse · AI 뉴스

딥 강화 학습 기반 연속 시간 최적 정지 문제 해결

arXiv cs.LG · 2026-06-16

연구진이 연속 시간 최적 정지 문제를 해결하기 위해 CARLOS라는 새로운 알고리즘을 개발했어요. 이 알고리즘은 딥 신경망을 활용해 공간-시간 의사 결정 경계를 학습하며, 시간 해상도를 자유롭게 조정할 수 있어요. 기존 방법보다 더 높은 가격을 산출하고, 계산 효율성도 높다는 결과가 나왔어요.

CARLOS 알고리즘은 초기 시간 격자를 세밀하게 조정하며, 딥 신경망을 통해 시간-가치 추정치를 개선해요. 또한, 정지 경계 근처에서 집중적으로 학습하도록 설계된 적응적 샘플링 전략을 사용해요.

벤치마크 결과 CARLOS는 기존 Bermudan 솔버보다 높은 가격을 제공하며, American 상한에 근접하는 성능을 보였고, 기존 RL 방식보다 계산 효율성이 높다는 점을 확인했어요.

##딥러닝##강화학습##최적정지##금융공학
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기