연구진은 로봇이 행동하기 전에 카메라를 움직이는 과정을 연구했어요. LIME은 자연어 의도를 기반으로 다음 관찰 시 상대적인 카메라 자세를 예측하는 카메라 모션 생성 모델이에요.
LIME은 에고센트릭 비디오에서 의도 기반 카메라 모션에 대한 다중 의도 감독 신호를 채굴하여, 관찰 결과에 대한 설명을 예측하는 자동 회귀 방식을 사용해요.
실험 결과, LIME은 수동 인간 비디오에서 카메라 자세를 적극적으로 선택하여 의도 기반 능동 인식을 위한 감독 신호로 활용될 수 있음을 보여줬어요.