연구진은 로봇 조작 시 발생하는 시야 가림과 빠른 카메라 움직임으로 인한 세계 모델의 기억 손실 문제를 해결하기 위해 Mem-World를 제안했어요.
Mem-World는 W-VMem이라는 4차원 손목 시야 중심 서펠 인덱스 메모리를 활용하여 과거 관찰 기록을 시간적으로 변화하는 표면 요소에 연결해 장면의 일관성을 유지해요.
실험 결과, Mem-World는 복잡한 조작 시나리오에서 지속적인 시뮬레이션 결과를 생성하고, 정책 평가 신뢰도를 높이며, 장기 과제 성공률을 58%에서 72%로 향상시키는 데 기여했어요.