Pulse · AI 뉴스

ImageWAM: 세계 행동 모델은 정말 비디오 생성이 필요한가, 아니면 이미지 편집만으로 충분한가?

ImageWAM · 2026-06-17

연구진은 세계 행동 모델(WAM)이 로봇 제어를 위해 비디오 생성을 의존하는 데 대한 대안으로 이미지 편집 모델을 활용하는 ImageWAM 프레임워크를 제안했어요.

ImageWAM은 비디오 생성을 대체하여 목표 프레임 변환만 모델링하고, 행동과 관련된 시각적 변화에 집중하며, 편집 사전 훈련을 통해 작업 지침을 시각적 변화에 연결하는 방식으로 작동해요.

ImageWAM은 기존 비디오 기반 WAM보다 FLOPs는 1/6로 줄이고, 지연 시간은 1/4로 단축하며, 시뮬레이터 및 실제 환경 실험에서 우수한 성능을 보여줘요.

##WAM##이미지편집##로봇제어##ImageWAM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기