연구진이 LLM의 논리적 오류에 대한 회피 능력을 평가하는 벤치마크 'LoFa'를 공개했어요. 기존 연구가 오류 식별에 집중한 반면, LoFa는 오류에 대한 설득 저항력을 측정합니다. LoFa는 다중 에이전트 파이프라인으로 구성되어 있으며, 모델의 회복력을 평가하기 위한 다중 라운드 토론 프레임워크를 포함합니다.