연구진이 GRAIL이라는 디지털 생성 파이프라인을 개발하여 로봇 시뮬레이션 환경 구축 없이 인간형 로봇의 로코-조작 상호작용을 합성합니다.
GRAIL은 3D 자산, 시뮬레이터 환경, 비디오 기반 모델(VFM)의 사전 지식을 결합하여 물리적 환경 재구축이나 로봇 원격 조작 없이 상호작용을 생성합니다.
GRAIL을 통해 생성된 2만 개 이상의 시퀀스를 활용하여 시뮬레이션 환경에서 시각적 정책을 학습하고 실제 Unitree G1 로봇에 적용하여 물체 집기 성공률 84%, 계단 오르기 성공률 90%를 달성했습니다.