연구진이 다중 에이전트 시스템의 불일치 감지를 위한 Arbiter 에이전트를 공개했어요. Arbiter는 실시간으로 대화를 모니터링하며, 제한된 자원으로 누가 불일치하게 행동하는지 파악해요.
다양한 대화 조건에서 Arbiter를 평가한 결과, 대화 종료 전에 불일치 에이전트를 정확하고 빠르게 감지할 수 있었어요. 능동적인 검사 도구는 정확도와 속도를 향상시켰어요.
가중치 유도 불일치는 가장 감지하기 어려웠지만, 지시 유도 불일치는 수동 관찰만으로도 안정적으로 감지 가능했어요. 로그 도구는 재현율을 높이는 대신 정밀도를 낮췄어요.