연구진은 다중 에이전트 강화 학습(MARL) 프레임워크에서 이벤트 기반 행동 전환을 가능하게 하는 새로운 프레임워크를 제안했습니다. 이 프레임워크는 에이전트의 정체성과 행동을 분리하여, 특정 시점에 에이전트가 다른 역할을 수행하도록 합니다.
Neural Manifold Diversity(NMD)라는 새로운 거리 측정 방식을 도입하여 표현력이 풍부한 행동 다양성 공간을 구축하고, 이벤트 기반 하이퍼 네트워크를 사용하여 공유된 팀 정책에 LoRA 모듈을 생성합니다.
실험 결과, 제안하는 프레임워크는 기존 방법보다 뛰어난 성능을 보이며, 순차적인 행동 재할당이 필요한 작업에서도 해결 가능성을 입증했습니다.