NVIDIA에서 SANA-WM이라는 새로운 오픈소스 월드 모델을 공개했어요. 이 모델은 이미지 1장과 6-DoF 카메라 궤적을 입력받아 720p, 1분 길이의 비디오를 생성합니다. Hybrid Linear Diffusion Transformer가 긴 롤아웃의 일관성을 유지하는 데 사용됐습니다.