Pulse · AI 뉴스

BadWorld: 세계 모델에 대한 적대적 공격

arXiv cs.CV · 2026-06-15

연구진은 시각 세계 모델(VWM)의 적대적 취약점을 평가하는 새로운 프레임워크 'BadWorld'를 제안했어요. BadWorld는 미래 영상에 대한 감독 없이, 사용자의 예측 불가능한 행동에도 대응할 수 있도록 설계됐어요. 실험 결과, VWM은 시각적으로는 차이가 없지만, 미래 예측 결과에 심각한 오류를 일으키는 적대적 이미지에 취약한 것으로 나타났어요.

BadWorld는 자기 지도 속도 공격을 통해 모델의 초기 노이즈 제거 과정을 방해하고, 2단계 최적화를 통해 예측 불가능한 사용자 제어에도 대응하는 적대적 변조를 생성해요. 연속적, 이산적 제어 모두에서 실험 결과, VWM은 심각한 구조적 취약성을 드러냈어요.

연구 결과는 안전 관련 시스템에 VWM을 배포할 때의 위험성을 강조하며, 개인 정보 보호를 위한 실용적인 메커니즘을 제시합니다.

##세계모델##적대적공격##VWM##AI보안##악성코드

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기