Hugging Face

影片 AI 不只是生成畫面，也包含理解影片中的物件、事件與因果關係。這支影片介紹 Netflix 開源的 VOID 模型，重點不是單純做特效，而是讓模型對影片內容有更深的分析能力。影片連結：https://www.youtube.com/watch?v=X5hsoy_hnkI 可以怎麼理解 VOID 它是偏向影片理解與分析的 AI 模型。重點在影片內容裡的事件、物件與關係，而不是單張圖片。這類模型未來可能影響搜尋、剪輯、推薦與自動標註。影片中提到的資源 GitHub：https://github.com/Netflix/void-model Hugging Face Demo：https://huggingface.co/spaces/sam-motamed/VOID 適合誰關注做影片內容、剪輯或資料整理的人。對多模態模型與影片 AI 有興趣的人。想觀察影音平台如何使用 AI 的人。小結這篇先把影片內容整理成可搜尋、可回來查的文字筆記。後續如果我有補充更多實測資料、指令或範例，也會再把文章更新得更完整。

如果你想研究開源 TTS，Qwen3-TTS 是很值得測試的一個方向。它不只可以做文字轉語音，也讓聲音克隆、語氣控制與工作流整合有更多可能。這篇把影片中的資源與流程整理成文字。影片連結：https://www.youtube.com/watch?v=0iS_QuERNI8 先從 Demo 認識模型 Hugging Face Space：https://huggingface.co/spaces/Qwen/Qwen3-TTS 官方介紹：https://qwen.ai/blog?id=qwen3tts-0115 為什麼搭配 ComfyUI 用節點式方式組合輸入、模型與輸出。方便把語音生成放進更大的影音工作流。適合反覆測試不同文字、音色與參數。聲音克隆注意事項請使用自己有權利使用的聲音素材。公開發布前確認模型與工具授權。先用短句測試，再處理長稿。小結這篇先把影片內容整理成可搜尋、可回來查的文字筆記。後續如果我有補充更多實測資料、指令或範例，也會再把文章更新得更完整。

Hugging Face

Netflix 第一個開源 AI 模型，直接改寫影片裡的因果

2026 最強開源 TTS｜Qwen3-TTS 聲音克隆 + ComfyUI 完整教學