Pulse · AI 뉴스

Odysseus: 강화 학습을 통해 100+ 턴 게임 의사 결정을 위한 VLM 확장

Odysseus · 2026-05-01

연구진은 비전-언어 모델(VLM)을 활용하여 100턴 이상의 장기적인 의사 결정을 요구하는 Super Mario Land 게임에서 강화 학습(RL)을 적용하는 방법인 Odysseus를 개발했습니다.

Odysseus 프레임워크는 기존 모델보다 평균 3배 높은 게임 진행률을 달성했으며, 다양한 레벨에서 성능 향상을 보였습니다.

연구 결과는 장기적인 다중 모달 환경에서 RL을 안정적이고 효과적으로 만드는 핵심 요소를 제시하고, VLM을 활용한 에이전트 개발에 대한 실질적인 지침을 제공합니다.

##VLM##강화학습##게임AI##Odysseus
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기