ZiT와 WAN을 로컬에서 사용 중인 사용자가 영화 및 뮤직비디오 제작을 위한 텍스트 음성 변환 설정을 찾고 있어요. ComfyUI 기반 워크플로우를 선호합니다. 현재 로컬 텍스트 음성 변환을 위한 추천 모델과 접근 방식이 있는지 문의했어요.
사용자는 ZiT와 WAN을 이미 로컬 환경에서 사용하고 있으며, 영화 및 뮤직비디오 제작을 위한 텍스트 음성 변환 설정을 찾고 있습니다. ComfyUI 기반 워크플로우를 선호하며, 현재 최적의 모델과 접근 방식을 문의했습니다.