이 논문은 임상 자연어 처리에서 신경망 모델의 예측을 설명하는 데 어려움이 있다고 지적해요. LIME과 SHAP 같은 방법이 널리 쓰이지만, 긴 비정형 의료 텍스트를 다룰 때는 한계가 있어요. 연구진은 병원 입원 기간 예측 과제에서 토큰 수준 및 교란 기반 설명 기법의 핵심적인 한계를 보여줘요.
토큰 수준 설명 기법은 정보가 없는 토큰을 과도하게 강조하고, 설명은 불안정하며, 일관성 없는 입력에 대해서도 높은 신뢰도를 보이는 경향이 있어요. 이러한 결과는 임상적으로 의미 있고, 의미적으로 기반을 두고, 언어적 노이즈에 강한 설명 전략의 필요성을 강조해요.