연구진이 태국어 중심의 대규모 음성 데이터셋으로 지속적인 훈련을 진행하여 최첨단 태국어 음성 복제 텍스트 음성 변환 모델인 자이TTS-v1.0을 개발했어요. 자이TTS-v1.0은 숫자와 태국어-영어 혼용 표현을 명시적인 텍스트 정규화 없이 직접 처리하여 실제 환경에서 흔히 발생하는 상황을 반영했어요. 짧은 구간 음성 생성 및 긴 구간 음성 생성 테스트에서 최고 수준의 성능을 달성했으며, 인간 평가에서 상용 모델보다 높은 평가를 받았어요.