Pulse · AI 뉴스

MineExplorer: 마인크래프트에서 MLLM 에이전트의 오픈월드 탐색 평가

MineExplorer · 2026-05-29

연구진은 MLLM 에이전트의 오픈월드 탐색 능력을 평가하기 위한 MineExplorer 벤치마크를 발표했어요.

MineExplorer는 마인크래프트 특정 지식에 의존적인 작업을 필터링하고, ReAct 스타일의 능력 기반으로 벤치마크를 구성했어요.

멀티 에이전트 합성 워크플로우를 통해 신뢰성 있는 인스턴스를 생성하며, 실험 결과 오픈월드 탐색은 여전히 어려운 과제로 나타났어요.

##MLLM##마인크래프트##벤치마크##에이전트##탐색
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기