WorldDirector는 지속적인 동적 객체 메모리와 자유로운 시점 탐색을 위한 제어 가능한 비디오 세계 모델 프레임워크입니다. 기존 세계 모델과 달리 물리적 역학을 픽셀 렌더링과 분리하고 시각적 관찰에 의존하지 않아 운동을 유지합니다.
LLM을 활용하여 3D 경로와 카메라 움직임을 조정하고, 이 조정된 경로를 비디오 생성 제어 신호로 사용하여 물리적 논리와 외관 안정성을 보장합니다. 장시간 시야에서 벗어난 동적 개체의 정확한 시각적 동일성을 유지합니다.
실험 결과, WorldDirector는 전례 없는 제어 가능성과 지속적인 동적 객체 메모리를 가진 복잡하고 확장된 이벤트 합성을 지원합니다.