TTS 평가에서 '자연스러움'에서 '적절함'으로 초점이 이동하고 있어요. 다양한 사용 환경에서 TTS 시스템의 적절성과 인간 유사성을 평가한 결과, 자연스러움과 무관하게 적절함은 사용 환경에 따라 달라져요. 표현력이 중요한 환경에서는 TTS 시스템의 성능 개선이 여전히 필요하며, 특정 환경에 최적화하면 다른 환경에서의 성능이 저하될 수 있어요.
TTS 시스템은 텍스트 읽기에서는 뛰어난 성능을 보이지만, 연기나 캐릭터 목소리 연출과 같은 표현력이 필요한 분야에서는 개선이 필요해요. 자연스러움 점수는 스타일화된 연설을 낮게 평가하고, 즉흥적인 연설을 높게 평가하는 경향이 있어요.