Xiaomi가 자율 주행을 위한 세계 모델의 두 가지 핵심 기능인 세계 표현과 세계 생성을 해결하는 통합 기술 시스템인 JWM을 공개했어요.
WorldRec은 희소 장면 쿼리를 기반으로 3D 공간에 구조화된 쿼리를 초기화하여 프레임 간 공간 일관성을 자연스럽게 강제하고 고해상도 3D 가우시안 장면 표현을 생성해요.
WorldGen은 양방향 사전 훈련 후 세 단계의 점진적 방식으로 인과적 미세 조정을 통해 온라인 인과적 비디오 생성을 가능하게 하며, 4회의 디노이징 단계로 고품질 비디오 생성 가능.