Google이 Gemini 3.1 Flash TTS를 공개하며, AI 음성의 품질과 제어 기능을 크게 향상시켰습니다.
새로운 모델은 자연스러운 음성 구현을 위해 Artificial Analysis TTS 벤치마크에서 높은 Elo 점수(1,211)를 기록했습니다.
Audio tags 기능을 통해 사용자는 AI 음성의 스타일, 속도, 전달 방식을 자연어 명령어로 세밀하게 조정할 수 있습니다.
Gemini 3.1 Flash TTS는 70개 이상의 언어를 지원하며, AI 생성 음성임을 식별할 수 있도록 SynthID 워터마킹 기술이 적용되었습니다.
개발자는 Google AI Studio, Vertex AI, Google Vids를 통해 Gemini 3.1 Flash TTS를 사용할 수 있으며, 기업 사용자를 위한 preview 버전도 제공됩니다.