본 연구는 중개 물류 문제를 다루며, 이를 여러 객체의 목표 지향적 MDP로 재정의합니다. 연구 방법은 그래프 신경망과 모델-프리 RL을 결합하여 환경 상태에서 작은 특징 그래프를 추출합니다. 본 연구는 트럭의 유한 용량을 고려하여 허브 간의 경로를 최적화하는 데 중점을 둡니다.