연구진이 495개 언어에 적용 가능한 UR-BERT라는 새로운 TTS 인코더를 제안했어요. 기존 G2P 방식의 한계를 극복하기 위해 다양한 문자 체계를 로마자 표현으로 통일했어요. 음성 토큰 예측 학습을 통해 음성 정보에 맞는 표현을 학습시켜 데이터 효율성을 높였어요. UR-BERT 기반 TTS 시스템은 다양한 언어와 환경에서 기존 모델보다 성능이 뛰어나고, 새로운 언어에도 강한 일반화 능력을 보여줬어요.