연구진은 보호 속성 정보 없이도 텍스트 데이터의 편향을 해제할 수 있는 H-SAL 방법을 제안했어요. H-SAL은 자기 설명 텍스트를 활용해 개념과 속성을 제거하는 방식이에요.
H-SAL의 성능을 검증하기 위해, 헬프풀니스 예측을 위한 다중 도메인 Stack Exchange 기반의 새로운 fairness 벤치마크를 만들었어요.
실험 결과, 자기 설명 텍스트를 활용한 편향 해제가 직접적인 속성 정보 기반의 편향 해제보다 성능이 높거나 유사한 결과를 보여줬어요.