사용자는 3주 동안 로컬 음성 비서 구축 프로젝트를 진행하며 TTS(Text-to-Speech) 모델을 개선해왔어요. Qwen3-TTS 모델을 도입한 결과, 이전 모델보다 표현력이 향상되었고 로봇처럼 들리지 않아 지속적으로 실행해도 괜찮게 되었어요. 현재 파이프라인은 Whisper -> Qwen3.6 -> Qwen3-TTS 순으로 구성되며, 도구 호출 시 응답 지연 문제를 해결하는 것이 과제예요.