연구진은 분산 학습 환경에서 협력적인 MARL을 위한 지식 공유 방식의 한계를 극복하기 위해 CCKS 프레임워크를 제안했어요.
CCKS는 합의 기반 제약 조건을 활용해 추천을 수용하고, 교사의 지시를 더 스마트하게 따르도록 설계돼 탐색과 학습의 균형을 맞춥니다.
Google Research Football 환경과 StarCraft II Multi-Agent Challenge 실험에서 기존 DTDE 방식보다 협력 효율성, 학습 속도, 전체 성능이 향상된 결과가 나타났어요.