Pulse · AI 뉴스

강화 학습에서의 일반화 능력 측정

OpenAI · 2018-12-06

새로운 훈련 환경 CoinRun을 공개했어요. 이 환경은 에이전트가 새로운 상황에 적응하는 능력을 측정하는 지표를 제공해요.

CoinRun은 기존 플랫폼 게임보다 단순하지만, 최신 알고리즘에게는 여전히 도전적인 일반화 과제를 제시해요.

CoinRun은 복잡성 균형이 잘 맞춰져 있어, 강화 학습의 오랜 난제를 해결하는 데 도움을 줄 수 있어요.

##강화학습##환경##일반화##CoinRun
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기