연구진은 제약 조건 기반 다중 에이전트 강화 학습(CMARL)의 복잡성을 해결하기 위해 조정 그래프(Coordination Graphs)를 활용한 CG-CMARL 프레임워크를 제안했어요.
CG-CMARL은 조정 그래프와 라그랑주 이중성을 결합하여 에이전트 수에 상관없이 학습 모델 수를 유지하고, 최대 합 연산 메시지 전달을 통해 행동을 조율해요.
실험 결과, CG-CMARL은 기존 방식보다 우수한 파레토 프런트를 생성하며, 중앙 집중식 접근 방식으로는 불가능한 규모의 팀에도 적용 가능했어요.