연구진은 복잡한 장기 연구 과제를 수행하는 LLM 에이전트의 delegation intelligence, 즉 과제 분해·위임·결과 통합 능력을 향상시키는 SearchSwarm 모델을 개발했어요.
SearchSwarm은 과제를 하위 과제로 분해하고, 하위 에이전트에게 위임하여 요약된 결과만 받는 방식으로 작동하며, 이를 위한 학습 데이터를 합성하고 모델을 훈련했어요.
SearchSwarm-30B-A3B 모델은 BrowseComp에서 68.1, BrowseComp-ZH에서 73.3의 최고 성능을 기록했으며, 학습에 사용된 harness, 모델 가중치, 학습 데이터는 공개될 예정이에요.