Pulse · AI 뉴스

Balti 음성 데이터셋 및 Whisper ASR 시스템 공개: Balti 언어 음성 인식 자원 부재 해소

Mozilla · 2026-06-02

연구진이 Balti 음성 데이터셋 'BaltiVoice'를 공개했어요. Balti 언어는 파키스탄 Gilgit-Baltistan 지역에서 사용되며, 기존에 공개된 음성 인식 자원이 없었어요.

BaltiVoice 데이터셋은 16.8시간 분량의 읽기 음성 데이터로, Mozilla Common Voice 녹음본을 기반으로 합니다.

OpenAI Whisper-small 모델을 BaltiVoice 데이터셋으로 fine-tuning하여 WER 30.07% 달성, zero-shot baseline 대비 182.18% 개선 효과를 보였어요.

##Balti##음성데이터셋##ASR##Whisper
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기