연구진은 카메라 위치 변화나 로봇 종류 변경(Panda → UR5e) 등 환경 변화 시 Vision-Language-Action (VLA) 모델의 성능 저하 문제를 해결하기 위해 Domain ARiThmetic (DART) 방법을 제안했어요.
DART는 환경 변화에 따른 VLA 모델 적응을 위해 단 하나의 데모만으로 효율적인 적응을 가능하게 하며, 가중치 벡터 연산을 통해 도메인별 정보를 추가하는 방식이에요.
시뮬레이션 및 실제 환경 실험에서 DART는 다양한 시각 및 로봇 변화 환경에서 기존 VLA 적응 방법보다 뛰어난 성능을 보였고, 코드는 GitHub에서 확인할 수 있어요.