연구진은 로봇이 실제 환경에서 실패를 겪을 때, 이전 실패를 학습하고 행동을 조정하여 자율적으로 작업을 완료할 수 있도록 하는 FAR(Failure-Aware Retry) 프레임워크를 제안했어요.
FAR은 실패-대조적 선호도 적응과 재시도 시 경량화된 동작 변경을 결합하여, 이전 실패 행동을 피하고 로컬 탐색을 장려해요.
시뮬레이션 및 실제 조작 작업 실험 결과, FAR은 표준 정책 대비 평균 17.6% 향상된 성공률을 보였고, 지속적 정책 개선 시 데이터 효율성도 크게 향상됐어요.