Pulse · AI 뉴스

TTS-PRISM: 미세한 진단을 위한 지각적 추론 및 해석 가능한 음성 모델

Xiaomi · 2026-04-24

TTS-PRISM은 기존 TTS 모델의 미세한 음향 결함을 진단하고 원인을 파악하기 위한 다차원 진단 프레임워크예요.

전문가 앵커와 적대적 교란을 활용하여 고품질 진단 데이터셋을 구축하고, 12차원 스키마를 기반으로 모델을 튜닝했어요.

TTS-PRISM은 1,600개 샘플의 Gold Test Set에서 인간의 평가와 일치하는 성능을 보였으며, 다양한 TTS 모델의 차이를 명확하게 보여주는 진단 플래그를 제시했어요.

##TTS##음성모델##진단##해석가능성##Xiaomi
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기