연구진이 카메라 제어 비디오 리렌더링을 위한 강화 학습 프레임워크 Geo-Align을 제안했어요. 기존 방식은 실제 영상 데이터 부족으로 인해 일반화 성능이 떨어지는 한계가 있었어요. Geo-Align은 3D 추정기를 활용해 생성된 비디오의 카메라 경로를 분석하고 회전·이동 오류를 줄이는 방식으로 작동해요.
실제 영상과 합성 데이터를 활용한 데이터 파이프라인 전략을 통해 페어 데이터 의존성을 없쳳어요. 기존 지도 학습 방식 대비 카메라 제어 정확도와 시각적 충실도 모두 향상된 결과가 나왔어요.
Geo-Align은 기존 방식의 한계를 극복하고 실제 환경에서도 정확한 카메라 제어와 시각적 품질을 확보하는 데 기여할 것으로 기대돼요.