Netflix 第一個開源 AI 模型,直接改寫影片裡的因果

影片 AI 不只是生成畫面,也包含理解影片中的物件、事件與因果關係。這支影片介紹 Netflix 開源的 VOID 模型,重點不是單純做特效,而是讓模型對影片內容有更深的分析能力。 影片連結:https://www.youtube.com/watch?v=X5hsoy_hnkI 可以怎麼理解 VOID 它是偏向影片理解與分析的 AI 模型。 重點在影片內容裡的事件、物件與關係,而不是單張圖片。 這類模型未來可能影響搜尋、剪輯、推薦與自動標註。 影片中提到的資源 GitHub:https://github.com/Netflix/void-model Hugging Face Demo:https://huggingface.co/spaces/sam-motamed/VOID 適合誰關注 做影片內容、剪輯或資料整理的人。 對多模態模型與影片 AI 有興趣的人。 想觀察影音平台如何使用 AI 的人。 小結 這篇先把影片內容整理成可搜尋、可回來查的文字筆記。後續如果我有補充更多實測資料、指令或範例,也會再把文章更新得更完整。

2026-04-06 · 1 min · AFA

2026 最強開源 TTS|Qwen3-TTS 聲音克隆 + ComfyUI 完整教學

如果你想研究開源 TTS,Qwen3-TTS 是很值得測試的一個方向。它不只可以做文字轉語音,也讓聲音克隆、語氣控制與工作流整合有更多可能。這篇把影片中的資源與流程整理成文字。 影片連結:https://www.youtube.com/watch?v=0iS_QuERNI8 先從 Demo 認識模型 Hugging Face Space:https://huggingface.co/spaces/Qwen/Qwen3-TTS 官方介紹:https://qwen.ai/blog?id=qwen3tts-0115 為什麼搭配 ComfyUI 用節點式方式組合輸入、模型與輸出。 方便把語音生成放進更大的影音工作流。 適合反覆測試不同文字、音色與參數。 聲音克隆注意事項 請使用自己有權利使用的聲音素材。 公開發布前確認模型與工具授權。 先用短句測試,再處理長稿。 小結 這篇先把影片內容整理成可搜尋、可回來查的文字筆記。後續如果我有補充更多實測資料、指令或範例,也會再把文章更新得更完整。

2026-01-25 · 1 min · AFA