연구진은 Vision-Language-Action(VLA) 모델의 능숙한 조작 과정에서 발생하는 복합적인 오류 문제를 해결하기 위해 HandITL(Hand-in-the-Loop) 방법을 제안했어요. HandITL은 인간의 교정 의도를 자율 정책 실행과 융합하여 로봇 손의 갑작스러운 움직임을 방지하는 기술이에요.
HandITL은 직접적인 원격 조작에 비해 takeover jitter를 99.8% 줄이고, 조작 성공률을 87.5% 향상시키며, 평균 완료 시간을 19.1% 단축하는 효과를 보여줬어요.
HandITL을 활용하여 수집된 교정 데이터는 기존 원격 조작 데이터로 훈련된 정책보다 평균 19% 더 우수한 성능을 나타냈으며, 양손 협응, 도구 사용, 장기 조작 등 다양한 작업에서 검증되었어요.