연구진이 로봇의 물리적 작동 능력과 의미 이해를 동시에 개선하는 GEM 모델을 발표했어요. GEM은 VLM 사전 훈련 단계에 깊이 지도 생성 작업을 통합하여 로봇 지능을 향상시킵니다. GEM-4M 데이터셋을 공개하여 다양한 로봇 벤치마크에서 최고 성능을 달성했어요. GEM-VLA 모델은 시뮬레이션 환경과 실제 환경 모두에서 뛰어난 작업 실행 능력을 보여줘요. 연구 결과와 모델, 데이터셋은 GitHub에서 확인할 수 있어요.