연구진이 3D 상자를 활용해 실제 이미지의 3D 편집을 제어하는 새로운 인터페이스를 개발했어요. 사용자는 입력 및 출력 상자를 지정하여 편집을 구조화된 기하학 문제로 정의할 수 있어요.
3D 상자는 색상 코딩을 통해 3D 방향을 전달하며, 번역, 회전, 크기 조정, 시점 변경을 정확하게 제어하고 장면과 객체의 동일성을 유지해요.
연구진은 장면의 일관성을 유지하기 위해 깊이 정렬된 평면 바닥을 도입하고, 합성 데이터와 실제 비디오를 활용하여 훈련하여 복잡한 실제 이미지에도 적용 가능함을 입증했어요.