OmniDirector는 참조 영상에서 카메라 움직임을 클론링하는 새로운 프레임워크입니다. 기존 방식의 한계를 극복하기 위해 카메라를 그리드 모션 비디오로 표현하여 다양한 트랙터리를 통합한 멀티샷 비디오 생성에 적합하도록 설계됐습니다. 연구팀은 카메라 그리드-비디오 페어 100만 개로 학습된 OmniDirector를 통해 캐릭터, 액션, 카메라를 조율하여 멀티모달 디퓨전 트랜스포머에 감독자 수준의 제어 기능을 제공합니다.