연구진이 정치적 논쟁 담론에서 함축적 추론을 탐지하기 위한 1,482개의 트윗 자료를 구축했어요. 이 자료는 5명의 평가자가 평가했으며, 평가자 간의 의견 차이를 연구하는 데 중점을 뒀어요.
자료는 앤서리(Walton)의 논증 체계를 기반으로 한 평가 지침을 통해 구조화됐으며, 주관적인 해석의 여지를 남겨두고 있어요. 기존 자료는 의견 불일치를 배제하는 경향이 있어, 모델 성능 연구에 한계가 있었어요.
연구 결과, 평가자 간 의견 불일치를 학습한 모델이 기존 모델보다 더 나은 성능을 보였으며, 주관적인 추론 과정의 변이를 연구할 수 있는 기반을 마련했어요.