Pulse · AI 뉴스

저자원 산투족 방언 음성 인식 위한 톤 기반 교육 커리큘럼 학습

W2V-BERT · 2026-06-30

연구진은 8천만 명 이상이 사용하는 산투족 방언의 음성 인식 성능을 개선하기 위해 톤 기반 교육 커리큘럼 프레임워크를 개발했어요. 하이브리드 난이도 점수, 톤 통계 기반 게이트 어댑터, 단계별 커리큘럼 학습을 결합해 6개 산투족 방언에 적용했어요. W2V-BERT는 Nguni 방언에서 Whisper보다 3~4% WER 포인트 향상, Whisper는 Sotho-Tswana 방언에서 더 나은 성능을 보였어요.

톤 조건부 W2V-BERT는 데이터셋 평균 28.41% WER, Xitsonga 전이 시 23.79% WER을 달성했어요. 단일 모델로 모든 방언에 적합하지 않으므로, 언어별 모델 선택과 코퍼스 검증이 중요해요.

##음성인식##산투족##커리큘럼학습##W2V-BERT##톤조건부
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기