연구진은 LLM의 취약점을 보완하기 위해 다중 에이전트 추론 프레임워크를 개발했어요. 이 프레임워크는 Manager가 Worker의 추론 설명을 종합하여 최종 예측을 생성합니다.
SemEval-2016, P-Stance, COVID-19 데이터셋에서 Llama, Mistral, Gemini 모델로 평가 결과, 암묵적 태도 감지에서 성능 향상을 보였어요.
COVID-19 데이터셋에서 Macro-F1 86.07, SemEval-2016에서 82.90을 달성하며, 표면 단서만으로 태도를 추론하기 어려운 경우에 효과적입니다.