Pulse · AI 뉴스

Qwen3-TTS + qwen3.6-35B를 활용한 음성 에이전트 파이프라인 구축: 3주간의 기록

Qwen · 2026-04-24

사용자는 3주 동안 로컬 음성 비서 구축 프로젝트를 진행하며 TTS(Text-to-Speech) 모델을 개선해왔어요.

Qwen3-TTS 모델을 도입한 결과, 이전 모델보다 표현력이 향상되었고 로봇처럼 들리지 않아 지속적으로 실행해도 괜찮게 되었어요.

현재 파이프라인은 Whisper -> Qwen3.6 -> Qwen3-TTS 순으로 구성되며, 도구 호출 시 응답 지연 문제를 해결하는 것이 과제예요.

##Qwen##TTS##음성비서##RAG##AI에이전트

매일 핵심 AI 소식을 한국어로, 빠르게