Pulse · AI 뉴스

위스퍼 기반 음성 신뢰도 감지 프레임워크

Whisper · 2026-05-13

본 연구는 제한된 라벨 데이터와 주관적인 비언어적 주석으로 인해 제약받는 화자 신뢰도 자동 감지를 위해 설계되었습니다.

위스퍼 인코더의 심층 의미 임베딩과 eGeMAPS 기술자, 보조적인 음성 스트레스 및 불유창 확률 추정치를 결합하는 하이브리드 프레임워크를 제안합니다.

제안된 접근 방식은 Macro-F1 점수 0.751을 달성하여 WavLM, HuBERT, Wav2Vec 2.0과 같은 자기 지도 기반 모델을 능가했습니다.

##음성인식##신뢰도##위스퍼##반지도학습

매일 핵심 AI 소식을 한국어로, 빠르게