AllenAI가 MolmoMotion 모델 패밀리의 두 가지 모델을 공개했어요. 이 모델들은 짧은 RGB 관찰 기록을 바탕으로 3D 점의 미래 궤적을 예측합니다. 3프레임과 1프레임 기록을 활용한 두 가지 버전이 제공돼요. MolmoMotion은 4B vision-language 모델로, 사용자가 지정한 2D 점의 3D 움직임을 자연어 액션 지시사항과 함께 예측합니다. 향후 궤적 예측에 활용될 수 있어요.