연구진이 Balti 음성 데이터셋 'BaltiVoice'를 공개했어요. Balti 언어는 파키스탄 Gilgit-Baltistan 지역에서 사용되며, 기존에 공개된 음성 인식 자원이 없었어요.
BaltiVoice 데이터셋은 16.8시간 분량의 읽기 음성 데이터로, Mozilla Common Voice 녹음본을 기반으로 합니다.
OpenAI Whisper-small 모델을 BaltiVoice 데이터셋으로 fine-tuning하여 WER 30.07% 달성, zero-shot baseline 대비 182.18% 개선 효과를 보였어요.