연구진은 월드 모델이 로봇 학습 데이터 생성에 활용되는 과정에서 데이터 포이즈닝 공격에 취약하다는 점을 발견했어요. 기존 데이터 포이즈닝은 직접적인 악성 경로 삽입이지만, 월드 모델 공격은 안전한 데이터에 악성 프롬프트를 주입하여 위험한 로봇 정책을 유도해요. 연구 결과는 최신 액션 기반 및 텍스트 기반 월드 모델 모두에 적용 가능하며, 다운스트림 DRL 정책에 대한 백도어 공격을 입증했어요.