연구진은 동일한 언어 모델을 활용한 다중 에이전트 논쟁(MAD)이 답변 정확도는 유지하면서도 추론 과정을 저하시키는 '추론의 함정' 현상을 발견했습니다. 이 현상은 답변의 다양성을 제한하고 특정 관점을 강화하는 경향을 보입니다.
새로운 프레임워크는 '증거 기반 소크라테스적 추론(EGSR)'을 도입하여 증거 기반 질문을 통해 답변의 정확성을 높이고, 'SFS(Supported Faithfulness Score)'라는 지표를 통해 분해된 원자적 주장을 증거에 기반하여 검증합니다.
연구 결과, MAD는 정보 이론적 관계에 의해 제한되며, 폐쇄형 시스템에서는 데이터 처리 불평등(DPI)의 영향을 받습니다. EGSR은 98%의 정확도를 회복하며, 인간 평가자의 일관성 부족을 보여줍니다.