Pulse · AI 뉴스

ZONOS2: 8B 파라미터의 실시간 TTS 모델, 고품질 음성 복제 기능 제공

ZONOS2 · 2026-06-13

Zyphra가 실시간 텍스트 음성 변환(TTS) 모델 ZONOS2를 공개했어요. 이 모델은 8B 파라미터로 구성되었으며, 900M 파라미터가 추론 시 활성화돼요. ZONOS2는 Apache 2.0 라이선스로 공개되었으며, Zyphra Cloud에서 AMD 하드웨어로 사용할 수 있어요.

ZONOS2는 음질과 속도 간의 균형을 맞추는 데 중점을 뒀으며, 특히 음성 복제 성능이 뛰어나 튜닝 없이도 자연스러운 복제 결과를 제공해요. 44.1kHz 스튜디오 품질의 오디오를 위해 Descript Audio Codec(DAC) 토큰을 사용해요.

Zyphra는 ZTTS1-Eval이라는 새로운 TTS 평가 벤치마크를 함께 공개했어요. 이 벤치마크는 17개 언어의 데이터 세트를 포함하며, Qwen3-ASR와 같은 최신 평가 모델을 사용해요.

##TTS##ZONOS2##음성복제##오픈소스
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기