연구진은 기존 동작을 개선하는 잔차 학습에서 샘플 효율성이 중요하다고 강조하며, 작업 오류 지향적 감독과 작업 오류 모델을 활용해 3공, 4공, 5공 제기연습을 구현했어요.
단순화된 스택을 통해 계획 및 제어했음에도 불구하고, 시스템은 두 번째 시도만에 수렴하며, 첫 번째 시도 후에는 더 이상의 실패 없이 작업 오류가 단조롭게 감소했어요.
연구 결과, 잔차 학습의 병목 현상은 감독 신호의 정보량과 학습자가 이를 활용하는 방식이며, 주변 스택의 정확도가 아니라는 점을 확인했어요. 실험 영상은 온라인에서 확인할 수 있어요.