연구진이 다양한 로봇 플랫폼에서 성능을 유지하는 VLA 모델 ZR-0을 공개했어요. ZR-0은 Embodied Chain-of-Thought (ECoT)를 활용해 로봇 제어 과정의 추론 능력을 향상시켰어요.
ZR-0은 2.6억 파라미터 규모의 end-to-end VLA 모델로, 장면 인식, 객체 식별, 작업 계획 등 인지 과정을 공유하는 점에 주목했어요.
ProcCorpus-60M 데이터셋으로 학습된 ZR-0은 LIBERO, RoboTwin 2.0, RoboCasa GR-1 Tabletop 시뮬레이션 환경과 xArm 플랫폼에서 뛰어난 성능을 보여줬어요.