如果你想研究開源 TTS,Qwen3-TTS 是很值得測試的一個方向。它不只可以做文字轉語音,也讓聲音克隆、語氣控制與工作流整合有更多可能。這篇把影片中的資源與流程整理成文字。
影片連結:https://www.youtube.com/watch?v=0iS_QuERNI8
先從 Demo 認識模型
- Hugging Face Space:https://huggingface.co/spaces/Qwen/Qwen3-TTS
- 官方介紹:https://qwen.ai/blog?id=qwen3tts-0115
為什麼搭配 ComfyUI
- 用節點式方式組合輸入、模型與輸出。
- 方便把語音生成放進更大的影音工作流。
- 適合反覆測試不同文字、音色與參數。
聲音克隆注意事項
- 請使用自己有權利使用的聲音素材。
- 公開發布前確認模型與工具授權。
- 先用短句測試,再處理長稿。
小結
這篇先把影片內容整理成可搜尋、可回來查的文字筆記。後續如果我有補充更多實測資料、指令或範例,也會再把文章更新得更完整。