연구진은 공간적 일반화를 위한 새로운 데이터 증강 프레임워크 R2RDreamer를 제안했어요. R2RDreamer는 3D 액션과 관측 데이터를 편집하고 2D 비디오 공간에서 시각적 완성을 수행하여 공간적 일관성을 유지해요.
불완전한 객체 포인트 클라우드와 엔드 이펙터 경로를 편집하고, 오클루전 인지 투영과 영상 기반 관측 완성을 통해 2D 조작 정책의 공간적 일반화를 개선해요.
2D 확산 스타일 정책과 시각-언어-액션 정책 모두에서 실험 결과, 제한된 소스 데모에서 공간적 일반화가 향상된 것을 확인했으며, 3D 편집, 오클루전 인지 투영, 비디오 완성이 기여했음을 분석했어요.