Reddit 사용자들은 디퓨전 기반 TTS 모델이 감정적인 텍스처와 리듬을 더 잘 포착한다고 느꼈어요. runable을 통해 실험한 결과, 불완전한 생성물조차도 자연스러운 '존재감'을 보여줬어요. 기존 오토리거시브 시스템이 어려워하는 감정 표현을 디퓨전 모델이 더 잘 구현하는 것 같다는 의견이 Reddit 커뮤니티에서 제기됐어요.