연구진은 데이터 분포가 균일하지 않은 연합 학습 환경에서 클러스터링 연합 학습의 효율성을 높이는 새로운 방법을 제시했어요. 각 클라이언트가 로컬 데이터를 기반으로 랜덤 네트워크 증류 예측기를 훈련하여 유사성을 추정하고, 이를 통해 클라이언트 그룹을 발견해요.
이 방법은 원시 데이터를 공유하거나 주 모델을 반복적으로 평가하지 않고도 의미 있는 클라이언트 그룹을 찾아내며, 클러스터링과 학습을 분리하여 계산 비용과 통신 비용을 절감해요.
특히, 클러스터 수는 사전에 지정할 수 없는 대규모 분산 시스템에서도 실시간으로 협력 구조를 형성할 수 있어, 자율적인 협업을 가능하게 해요.