HumanScale 연구팀은 에고센트릭 인간 비디오가 실제 로봇 데이터보다 효과적인 몸체 AI 모델 사전 훈련 데이터가 될 수 있음을 밝혔어요.
필터링 및 라벨링 파이프라인을 통해 처리된 에고센트릭 데이터는 실제 로봇 액션 예측에서 검증 손실이 24% 더 낮았고, 실제 로봇 작업 성공률이 52.5% 및 90% 더 높았어요.
연구 결과는 몸체 AI 모델의 확장 가능한 패러다임을 제시하며, 에고센트릭 인간 비디오로 다양한 세계 표현을 학습하고 소량의 실제 로봇 데이터로 액션 공간을 정렬하는 방법을 제안해요.