연구진이 Transformer 기반 자동 음성 인식(ASR) 모델의 예측 해석을 돕는 LEAF-X 프레임워크를 개발했어요. 엔트로피 기반 어텐션 가중치, 다층 어텐션 롤아웃, 선택적 인과적 제거를 결합하여 모델의 핵심 부분 분석 가능. 기존 설명 방식보다 **32%** 더 높은 신뢰도와 **35-39%** 더 강력한 지역성/희소성을 보여줘요.
LEAF-X는 음향 인코더-디코더 및 음성 증강 디코더 전용 모델의 내부 구조를 활용하여 모델 계산을 더 잘 반영하는 설명을 생성해요. 기존 방식은 성능 저하나 시간적 정밀도 부족 문제가 있었어요.
연구 결과, LEAF-X는 기존 방식보다 더 투명하고 감사 가능한 ASR을 지원하며, 어텐션 기반 설명의 안정성을 높여줘요.