DexCompose는 숙련된 조작 정책을 재활용하여 여러 작업을 수행하는 새로운 프레임워크입니다. 기존 조작 결과 유지를 보존하면서 새로운 작업을 실행하는 데 발생하는 충돌을 해결합니다. 연구진은 손가락 수준의 동작 소유권을 명시적으로 활용하여 숙련된 정책을 구성하는 방법을 제시했습니다.
DexCompose는 기존 기술의 성공적인 후속 상태를 수집하고, 손가락 마스크를 테스트하여 기존 기술 상태를 유지하는 데 필요한 손가락을 식별합니다. 이를 바탕으로, 기존 조작 결과 보존을 위한 제한된 잔여 안정화 모듈과 새로운 작업에 적응하는 컨텍스트 인식 잔여 모듈을 훈련합니다.
16가지 복합 숙련된 조작 작업에서 DexCompose는 77.4%의 평균 성공률을 달성하여, 구조화된 동작 소유권과 이중 잔여 모듈이 기존 정책 체인 방식보다 유망한 방향을 제시함을 입증했습니다.