Pulse · AI 뉴스

FiLM 기반 음성 조건부 SpeechLLM을 활용한 병리학적 음성 인식

SpeechLLM · 2026-06-04

연구진은 신경학적 질환으로 인한 병리학적 음성 인식을 개선하기 위해 FiLM(Feature-wise Linear Modulation)을 활용한 음성 조건부 SpeechLLM 모델을 개발했어요. x-vector 정보를 활용해 ASR 인코더의 각 트랜스포머 레이어에 주입하여 병리학적 음성에 적응시키는 방식으로, 기존 모델 가중치를 수정하지 않아요. 스페인어와 영어 병리학적 음성 데이터셋에서 기존 방식 대비 경쟁력 있는 성능을 확인했어요.

##음성인식##병리학##SpeechLLM##FiLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기