연구진은 딥러닝 의료 영상 분류 모델에서 연령, 성별, 인종 등 인구 통계학적 특성에 따른 하위 그룹 성능 차이가 발생한다는 것을 확인했어요.
이러한 차이는 이전 학습 모델에서 긍정 예측 시 주요 중간층 활성화 채널이 질병 양성 샘플과 우대 인구 집단(남성, 고령 환자)에 의해 공동 활성화되어 과진단을 유발하는 데서 비롯돼요.
연구진은 뉴런 발생 재분배(NIR)라는 경량화된 정규화 방법을 제안하여 예측 확률 가중 평균 활성화의 분산을 벌금 부과하며, 학습 시 인구 통계학적 레이블이 필요 없도록 했어요.