연구진은 로봇 학습에서 월드(World)와 태스크(Task)를 분리하는 새로운 프레임워크를 제안했어요. 월드는 로봇과 환경의 고유한 속성, 태스크는 목표 달성을 위한 논리를 의미합니다.
AICON이라는 차별화 가능한 그래프 기반 추정기(estimator)와 간결하게 학습된 정책을 결합하여 월드와 태스크 간의 상호작용을 구현했어요. 이 방식은 기존 방식보다 뛰어난 성능을 보여줍니다.
새로운 프레임워크는 다양한 로봇, 환경, 태스크 논리, 센서모터 양식에서 기존 방식보다 뛰어난 성능을 보였으며, 실제 하드웨어로의 이전 시에도 재학습이 필요 없었어요.