연구진이 37개 저자원 언어를 위한 대규모 음성 합성 벤치마크인 OpenBibleTTS를 공개했어요.
Gemini-TTS는 대부분의 언어에서 청취자 평가 점수가 가장 높았지만, EveryVoice 모델은 지능성 면에서 강점을 보였고 일부 아프리카 언어에서 선호됐어요.
OpenBibleTTS는 저자원 음성 합성 연구를 지원하기 위해 처리된 데이터셋, 정렬, 학습된 모델을 공개하며, 광범위한 다국어 커버리지와 저소외 언어 지역의 안정적인 합성 품질 간의 격차를 보여줘요.