연구진은 복잡한 환경에서 다중 에이전트 경로 탐색(MAPF) 문제를 해결하기 위해 Discrete Denoising Diffusion Probabilistic Model (D3PM)과 LNS2를 결합한 DiffLNS 프레임워크를 제안했습니다.
D3PM은 전문가 데모를 기반으로 좌표 다중 에이전트 행동 경로의 시공간적 패턴을 학습하여 다양한 초기 계획을 생성하고, LNS2는 이를 바탕으로 미완성 경로를 완성하고 충돌을 해결합니다.
DiffLNS는 96명까지의 에이전트로 훈련되었음에도 312명까지의 환경에서 일반화 성능을 보이며, 20개의 복잡한 환경에서 95.8%의 성공률을 기록했습니다.