연구진이 LLM 추론 성능 향상을 위해 다중 에이전트 논쟁(MAD) 프레임워크 ARMOR-MAD를 제안했어요. ARMOR-MAD는 논쟁을 조건부 연산으로 보고, 사전 합의 라우팅, 조기 합의 중단 평가, 의미 이상 탐지 세 가지 요소를 결합해요. MATH Level 5, GSM8K, MMLU, MMLU-Pro 데이터셋에서 기존 방식보다 정확도가 향상됐어요.
ARMOR-MAD는 사전 합의 라우팅(PAR)으로 불필요한 논쟁을 줄이고, 조기 합의 중단 평가(EASE)로 논쟁을 조기에 종료하며, 의미 이상 탐지(SOD)로 비정상 답변의 영향력을 줄여요. 이 방식은 모델 풀을 동일하게 사용했을 때도 기존 방식보다 성능이 향상됐어요.
연구 결과, 모델 간의 진정한 다양성과 합의 기반 제어가 MAD의 정확성과 효율성을 높이는 데 중요함을 보여줘요.