연구진이 다양한 동적 특성을 가진 자율 표면 차량에 적용 가능한 교차 플랫폼 제어 기술을 개발했어요. 강화 학습 기반 접근 방식을 사용해 시뮬레이션 환경에서 훈련된 정책을 실제 플랫폼에 적용했는데요. 두 개의 실제 플랫폼에서 실험 결과, 기존 방식 대비 위치 평균 절대 오차를 최대 58% 줄이는 성과를 냈어요.
학습된 모듈은 플랫폼 동역학의 잠재적 표현을 추론하여 부분 관찰 접근 방식을 사용해 교차 플랫폼 일반화를 해결했어요. 간단한 분석 동역학 모델을 사용했지만, 고정밀 수 hydrodynamic 시뮬레이터 없이도 가능했어요.
연구 결과, 적응형 정책은 플랫폼별로 조정된 컨트롤러에 근접한 추적 정확도를 보이면서도 기존 방식보다 훨씬 뛰어난 성능을 냈어요.