연구진은 복잡한 추론이 필요한 질문 답변에서 효율적인 탐색과 학습을 위해 역할 분해 기반 다중 에이전트 훈련 프레임워크 DAC를 제안했어요. DAC는 증거 수집과 답변 생성을 분리하여 각 역할을 담당하는 전용 에이전트를 활용하고, 역할별 학습 신호를 통해 학습 효율성을 높여요. 실험 결과, DAC는 기존의 단일 모델 기반 방식보다 뛰어난 성능을 보였으며, LoRA 모듈을 활용하여 파라미터 효율성을 높였어요.