연구진은 잠재력 기반 보상 성형(PBRS)과 제어 리아푸노프 함수(CLF), 제어 장벽 함수(CBF)를 결합하여 드론의 임무 시간 최적화와 안전 보장을 동시에 달성하는 방법을 제시했습니다. 일반화된 간단한 환경에서 RL 모델을 학습시킨 후, 추가 훈련 없이 CLF-CBF-QP 필터를 적용하여 복잡한 시나리오에서 활용했습니다. 시뮬레이션 환경에서 실험 결과, 임무 시간이 크게 단축되고 복잡한 환경에서도 뛰어난 성능을 보여주었습니다.