Pulse · AI 뉴스

자기 지도 음성 모델의 학습 표현에서 차원성 인지 이상 탐지

WavLM · 2026-05-05

연구진은 WavLM과 wav2vec 2.0 모델의 레이어별 표현에서 Local Intrinsic Dimensionality (LID)를 활용하는 GRIDS 프레임워크를 제시했습니다.

LID는 낮은 신호 대 잡음비(SNR) 환경에서 증가하며, 적대적 입력에서는 LID가 높게 유지되는 경향을 보입니다.

LID 상승은 단어 인식률(WER) 증가와 함께 나타나며, 이를 활용한 이상 탐지(AUROC 0.78-1.00)가 가능합니다.

##음성인식##자기지도학습##이상탐지##WavLM##wav2vec2.0
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기