연구진이 다양한 작업을 빠르게 해결할 수 있도록 고수준 행동을 학습하는 계층적 강화 학습 알고리즘을 개발했어요. 이 알고리즘은 수천 개의 타임스텝이 필요한 작업도 빠르게 해결할 수 있도록 지원해요. 내비게이션 문제에 적용했을 때, 걷기 및 기어다니기 방향에 대한 고수준 행동을 발견하여 새로운 내비게이션 작업을 빠르게 습득할 수 있도록 했어요.