본 연구는 혐오 표현 탐지와 같은 주관적인 작업에서 인구 통계 정보가 언제 도움이 되는지 질문합니다. 데이터 분할 특성 및 모델링 프레임워크에 따라 인구 통계 정보의 효과가 달라지는 것을 확인했습니다. 훈련 불일치가 낮고 테스트 불일치가 높으며, 미묘한 모호성 측정이 필요하고, 충분한 훈련 데이터와 더 큰 인구 통계적 중복이 있을 때 인구 통계 정보의 효과가 집중되는 것을 발견했습니다.
연구진은 텍스트 예측에 인구 통계 정보를 선택적으로 조정하는 게이트된 인구 통계 잔차 모델을 소개했습니다. MHS 및 POPQUORN 데이터셋 실험 결과, 불일치가 높거나 신뢰도가 낮은 예제에서 효과적임을 확인했습니다.
결과적으로, 인구 통계 정보는 기본적으로 유용하다고 가정해서는 안 되며, 그 가치는 데이터 체제와 모델링 프레임워크에 따라 달라집니다.