Pulse · AI 뉴스

minWM: 실시간 인터랙티브 비디오 월드 모델 구축을 위한 오픈소스 프레임워크

minWM · 2026-05-28

minWM은 실시간 인터랙티브 비디오 월드 모델 구축을 위한 풀스택 오픈소스 프레임워크입니다. 기존 T2V/TI2V 비디오 모델을 카메라 제어 가능한 월드 모델로 변환하는 엔드투엔드 파이프라인을 제공합니다.

minWM은 양방향 비디오 디퓨전 모델을 카메라 제어에 맞춰 파인튜닝하고, Causal Forcing/Causal Forcing++ 파이프라인을 적용하여 저지연 롤아웃을 위한 몇 단계의 자기회귀 생성기로 증류합니다.

Wan2.1-T2V-1.3B, HY1.5-TI2V-8B 등 다양한 오픈소스 백본을 지원하며, 기존 비디오 월드 모델을 새로운 데이터 분포에 적응시키는 기능도 제공합니다.

GitHub, 체크포인트, 문서, 추론 코드를 공개하며, 카메라 경로 품질, 제어 가능성 훈련 단계, 최소 배치 크기 요구 사항에 대한 분석 결과도 함께 제공합니다.

##비디오월드모델##오픈소스##인터랙티브AI
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기