본 논문은 액터와 크리틱 네트워크 간 공유 백본을 활용한 Shared Backbone PPO 알고리즘을 제안합니다. 제안된 알고리즘은 효율적인 학습과 향상된 성능을 달성합니다. 멀티-UAV 통신 커버리지 작업에서 연결을 유지하며 표준 PPO 알고리즘과 비교했습니다.
실험 결과, 제안된 방법이 우수한 성능을 보였습니다. 에이전트 간 통신 조건을 수용하기 위해 그래프 정보 집계 모듈을 모델 아키텍처에 통합했습니다.
통합 모듈 덕분에 알고리즘은 효과적이며, 학습된 에이전트 스웜은 더 높은 수준의 협력을 보였습니다.