연구진이 액션 기반 항공 영상 생성 기술인 Aero-World를 제안했어요. Aero-World는 기존 이미지-영상 확산 모델을 제어 가능한 항공 영상 생성기로 변환하는 방법이에요.
Aero-World는 액션 토큰 스트림을 통해 가속도와 각속도 시퀀스를 주입하여 항공 영상 생성해요. Physics Probe를 활용해 실제 영상-IMU 데이터 쌍으로 독립적으로 학습하여 미세 조정 과정에서 물리적 일관성을 감독해요.
연구진은 AeroBench 벤치마크를 통해 액션 신호에 대한 영상의 일치도를 평가하고, 물리적 일관성을 측정하는 Physical Consistency Rate를 제시했어요.
Aero-World는 기존 방식 대비 Action Alignment Score를 향상시키고, FVD는 낮추고, SSIM과 Flow-IMU 상관관계를 높여 액션에 더 잘 맞는 항공 영상을 생성하는 것을 확인했어요.