연구진은 시각적 지능의 핵심인 3D 점 궤적 예측을 위한 새로운 프레임워크인 MolmoMotion을 발표했어요. MolmoMotion-1M 데이터셋은 116만 개의 비정형 영상에서 추출한 3D 점 궤적을 액션 설명과 함께 담고 있으며, PointMotionBench 벤치마크는 인간 검증을 거쳤어요. MolmoMotion 모델은 기존 예측 모델보다 뛰어난 성능을 보이며, 로봇 조작 훈련 효율성 향상 및 사실적인 영상 생성에도 기여해요.