2026 最強開源 TTS｜Qwen3-TTS 聲音克隆 + ComfyUI 完整教學

Qwen3-TTS 讓開源語音生成再次進化。這篇整理 Hugging Face Demo、官方資訊與 ComfyUI 實作方向。

2026-01-25 · 1 min · AFA

Table of Contents

先從 Demo 認識模型
為什麼搭配 ComfyUI
聲音克隆注意事項
小結

如果你想研究開源 TTS，Qwen3-TTS 是很值得測試的一個方向。它不只可以做文字轉語音，也讓聲音克隆、語氣控制與工作流整合有更多可能。這篇把影片中的資源與流程整理成文字。

影片連結：https://www.youtube.com/watch?v=0iS_QuERNI8

先從 Demo 認識模型

Hugging Face Space：https://huggingface.co/spaces/Qwen/Qwen3-TTS
官方介紹：https://qwen.ai/blog?id=qwen3tts-0115

為什麼搭配 ComfyUI

用節點式方式組合輸入、模型與輸出。
方便把語音生成放進更大的影音工作流。
適合反覆測試不同文字、音色與參數。

聲音克隆注意事項

請使用自己有權利使用的聲音素材。
公開發布前確認模型與工具授權。
先用短句測試，再處理長稿。

小結

這篇先把影片內容整理成可搜尋、可回來查的文字筆記。後續如果我有補充更多實測資料、指令或範例，也會再把文章更新得更完整。