연구진은 실세계 로봇 조작에서 인간의 개입을 줄이는 새로운 HiL-RL 프레임워크인 UniIntervene을 제안했어요. UniIntervene은 비생산적인 탐색을 감지하고, 목표 상태로 정책을 회복하여 인간 운영자의 개입을 줄여줍니다. 실세계 조작 작업에서 UniIntervene은 성공률을 8.6% 향상시키고 인간 개입을 57% 줄이는 효과를 보였어요.