Pulse · AI 뉴스

해석 가능성이 불균등하게 분배될 때: 하이브리드 해석 가능 모델의 공정성

arXiv cs.LG · 2026-05-28

하이브리드 해석 가능 모델은 투명한 구성 요소와 블랙박스 모델을 결합하여 일부 예제에는 투명성을 적용하고 나머지는 블랙박스에 위임합니다. 이 설계는 정확성과 해석 가능성 간의 유연한 균형을 가능하게 하지만, 특정 인구 집단이 체계적으로 해석 가능한 결정을 받는 반면 다른 집단은 블랙박스로 불균등하게 연결될 수 있다는 절차적 공정성 문제를 야기합니다.

연구진은 하이브리드 해석 가능 모델의 라우팅 결정에 적용되는 인구 파리티 스타일 측정 기준인 해석 가능성 커버리지 불일치(ICD)를 공식화했습니다. 예측 가능성 도구를 사용하여 4가지 하이브리드 해석 가능 학습 방법, 3가지 표준 공정성 벤치마크 데이터 세트, 여러 민감한 속성을 연구했습니다.

실험 결과, 투명성과 블랙박스 구성 요소가 모두 적극적으로 사용되는 중간 투명성 영역에서 상당한 ICD가 발생하는 것으로 나타났습니다. 또한 간단한 커버리지 불일치 제약 조건을 정확한 하이브리드 학습 방법에서 ICD를 크게 줄이는 데 사용할 수 있으며 정확성과 희소성에 미치는 영향은 미미합니다. 여러 환경에서 ICD 완화는 표준 알고리즘 공정성 지표를 개선하는 데 도움이 됩니다.

##공정성##해석가능성##하이브리드모델##AI

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기