연구진이 Reddit의 생태 윤리 논쟁에 대한 맥락 인식 데이터셋 BioStance를 공개했어요. BioStance는 39,600개의 Post-Comment 쌍으로 구성되어 있으며, 6가지 논쟁 주제를 다루고 있어요. 연구진은 입지 감지, 논쟁 채굴, 생태 윤리 담론 분석 연구를 지원하기 위해 이 데이터셋을 만들었어요.
데이터셋은 3가지 차원의 생태 윤리 논쟁을 포괄하며, 각 인스턴스는 계층적 대화 맥락을 보존하고 있어요. 3명의 독립적인 어노테이터가 3가지 입지 분류 체계(찬성, 반대, 중립)를 사용하여 어노테이션을 수행했으며, Krippendorff's $α$는 0.82로 높은 신뢰도를 나타냈어요.
BioStance는 주제 다양성, 대화 구조, 고품질의 인간 어노테이션을 결합하여 맥락 인식 입지 감지, 논쟁 채굴, 생태 윤리 담론에 대한 계산 분석을 지원할 수 있을 것으로 기대돼요.