연구진은 다중 에이전트 강화 학습에서 행동 이질성을 측정하는 System Neural Diversity (SND)의 계산 복잡도를 줄이기 위해 Graph-SND를 새롭게 제안했습니다.
Graph-SND는 기존 SND 방식의 완전 그래프 평균을 임의 그래프의 가중 평균으로 대체하여 계산 비용을 효율적으로 관리합니다.
실험 결과, Graph-SND는 기존 SND의 의미를 유지하면서도 계산 시간을 10배 단축하고, GPU 타이밍을 예측된 속도로 개선하는 등 우수한 성능을 보였습니다.