Azure TTS를 활용한 영어-한국어 혼합 언어 학습 앱 개발 시 자연스러운 발음 구현에 어려움을 겪고 있어요.
Multilingual Voice는 문장 흐름은 좋지만 한국어 발음이 어색하고, SSML Voice Switching은 발음 전환 시 끊김 현상이 발생해요.
Azure에서 음성 전환 시 마이크로 일시 중지가 발생하는 것을 방지하는 SSML 트릭이 있는지, 혹은 Azure OpenAI 음성(alloy, nova)으로 전환하는 것이 효과적인지 궁금합니다.
혼합 언어 TTS 구현에 대한 조언이나 최적 기술 스택에 대한 정보가 필요합니다.