這不是一篇「AI 工具清單」。這是一篇我如何把 Codex App 變成一人影視製作工作台的實作紀錄。

以前,一支高完成度影片背後通常不是一個人。

你需要導演、編劇、攝影、美術、剪輯、聲音設計、動態設計,最後還要有人負責標題、封面、短影音和發行。

但現在問題變得很奇怪:如果 AI 可以幫我研究、寫稿、分鏡、生成 B-roll、做旁白、做字幕、做動畫,甚至幫我拆短影音,那一個人能不能真的逼近一間小型製片廠?

這就是我這支影片想測試的事。

我的結論不是「AI 可以一鍵拍完一支好片」。剛好相反。

真正可行的一人製片廠,不是全自動成片機,而是一套混合系統:

  • AI 負責壓縮製作勞動
  • Codex App 負責建立可重複的工作流
  • Remotion 負責穩定控制動畫、字卡、圖表和字幕
  • 人負責導演判斷、剪輯判斷、聲音判斷和最終取捨

一句話說完:

AI 可以壓縮製作勞動,但不能壓縮導演判斷。

下面是我實際用 Codex App 建立「一人製片廠」的流程。


1. 先不要急著裝一堆 AI 工具

很多人開始做 AI 影片,第一反應是去研究最新工具:哪個模型畫質最好、哪個可以圖生影片、哪個可以做配音、哪個可以做字幕。

但我這次反過來。

我不是先問:「我要用哪些工具?」

我先問:「一支影片到底需要哪些判斷?」

因為影片不是一串素材。影片是一連串判斷:

  • 題目值不值得拍?
  • 前 5 秒要用什麼衝突抓住觀眾?
  • 哪一段需要圖表?
  • 哪一段需要 B-roll?
  • 哪一顆鏡頭是建立世界觀?
  • 哪一顆鏡頭只是裝飾?
  • 哪裡要加速?
  • 哪裡要停下來?
  • 聲音在哪裡要有壓力?
  • 觀眾看完後記得哪一句話?

所以我在 Codex App 裡建立的不是「工具箱」,而是「製作工作台」。


2. 建立專案資料夾:讓每一步都有地方沉澱

我先請 Codex App 建立一個 video essay 專案資料夾。

我用的指令大概是:

幫我建立一個 video essay 製作工作台。
題目是:我能不能用 AI 做出一間「一人製片廠」?
請建立資料夾、prompt templates、研究文件、腳本文件、分鏡表、發行計畫。

接著我把專案整理成這樣:

ai-video-ad-agency-workbench/
  agent_flow/
    00_brief.md
    01_topic_agent.md
    02_research_agent.md
    03_thesis_agent.md
    04_story_core_agent.md
    05_script_agent.md
    06_critic_agent.md
    07_visual_director_agent.md
    08_storyboard_agent.md
    09_sound_design_agent.md
    10_edit_review_agent.md
    11_distribution_agent.md
    prompts/
  01_research/
  02_story/
  03_script/
  04_storyboard/
  05_release/
  06_assets/
  07_exports/
  08_checklists/
  automation/
  render_pipeline/

這個結構很重要。

因為 Codex App 最強的地方,不是一次回答你一個問題,而是可以在同一個 workspace 裡讀取、修改、延續檔案。

也就是說,我不用每次都重新解釋我的影片在做什麼。

每個 Agent 的輸出,都會變成下一個 Agent 的輸入。


3. 先寫 Brief:讓所有 Agent 有同一個上下文

每支影片開始,我先建立 agent_flow/00_brief.md

這份 brief 不是給觀眾看的,是給整個製作系統看的。

它要回答:

  • 這支片的題目是什麼?
  • 目標觀眾是誰?
  • 影片不是什麼?
  • 核心論點是什麼?
  • 視覺風格是什麼?
  • 第一版要做到哪裡?
  • 哪些事情暫時不做?

這次我的題目是:

我能不能用 AI 做出一間「一人製片廠」?

核心論點是:

AI 可以讓一個人完成過去小團隊的許多製作勞動,
但它不能讓一個缺乏判斷力的人自動變成製片廠。

這一步的重點是:不要讓 Codex 只是在幫你「產文案」。

你要讓它進入一個固定製作上下文。


4. 用 Topic Agent 先產題目,讓人做選擇

我不建議一開始就全自動跑完整支片。

比較好的方式是:先讓 Codex 產題目,然後人來選。

我會下這種指令:

使用 Topic Agent,根據 agent_flow/00_brief.md,
產出 10 個 video essay 題目,
寫到 agent_flow/01_topic_agent.md。

為什麼要停在這一步?

因為選題是人類判斷的第一個關卡。

AI 可以給你很多題目,但它不知道哪一個最符合你的頻道方向、觀眾期待、商業價值和你現在真的能做出來的能力。

所以我的流程不是「AI 自動決定題目」,而是:

  1. AI 產出 10 個方向
  2. 我選其中一題
  3. Codex 再從 Research Agent 開始往下跑

例如:

我選第 2 題。執行 automation/run_full_flow.md,
從 Research Agent 開始,不要重跑 Topic Agent。

5. 用 Research Agent 把題目變成資料包

選題之後,下一步不是寫稿。

下一步是研究。

Research Agent 會整理:

  • 核心背景
  • 重要案例
  • 時間線
  • 反方觀點
  • 可視覺化素材
  • 來源清單
  • 需要查核的主張

我會讓它把結果寫到:

agent_flow/02_research_agent.md
01_research/research_dossier.md
01_research/source_log.md

這樣做有兩個好處。

第一,腳本不會只剩空泛觀點。

第二,之後要寫 YouTube description、部落格、來源補充時,不用回頭翻聊天紀錄。

所有研究都沉澱在專案裡。


6. 用 Thesis Agent 把研究收斂成一句話

研究之後,我會讓 Thesis Agent 做一件事:把資料收斂成核心命題。

這一步非常重要。

因為 video essay 最怕變成「我查到很多資料,所以全部講一遍」。

好的影片要有一條脊椎。

這支片的脊椎是:

AI 可以壓縮製作勞動,但不能壓縮導演判斷。

這句話會決定後面所有東西:

  • 開場怎麼設計
  • 哪些資料要保留
  • 哪些工具只是背景
  • 哪些畫面要做
  • 結尾要留下什麼記憶點

我會用這種指令:

使用 Thesis Agent,根據 agent_flow/02_research_agent.md,
產出核心論點與章節架構,
寫到 agent_flow/03_thesis_agent.md。

7. 用 Story Core Agent 建立衝突和情緒曲線

有論點還不夠。

影片不是論文。影片需要衝突、節奏和情緒。

所以我會再跑 Story Core Agent,讓它建立:

  • Hook
  • 問題
  • 測試
  • 拆解
  • 結論
  • 情緒曲線
  • 每段畫面任務
  • 觀眾記憶點

這支片最後變成這樣的結構:

  1. 一個人能不能變成製片廠?
  2. AI 會生成影片,但不會替你成為導演
  3. 一支影片其實是很多判斷疊在一起
  4. AI 現在能壓縮哪些工作?
  5. 為什麼還不能全自動?
  6. 我的最小可行一人製片廠
  7. 真正的門檻是作品標準
  8. 答案是可以,但條件很硬

這一步是在避免影片變成工具列表。

我不是在介紹 AI 影片工具。

我是在回答一個問題:

一個人加上 AI,到底能不能逼近一間小型製片廠?


8. 用 Script Agent 寫旁白稿

故事結構確定後,才進入腳本。

我的指令是:

使用 Script Agent,根據 agent_flow/03_thesis_agent.md
和 agent_flow/04_story_core_agent.md,
寫 10-12 分鐘旁白稿,
寫到 03_script/script_draft.md。

這裡有一個關鍵:我不只叫 Codex 寫稿。

我會要求它每段都要有:

  • 旁白內容
  • 畫面提示
  • 需要查核的地方
  • 節奏功能

例如這支片裡,腳本不只是說「AI 很強」,而是會要求畫面顯示:

傳統製作角色卡片快速出現,
壓縮到一張深夜工作桌;
螢幕上同時有 brief、script、storyboard、
Remotion preview、AI B-roll、timeline。

也就是說,腳本一開始就要服務影像。


9. 用 Critic Agent 嚴格審稿

我不會讓 Script Agent 寫完就直接進製作。

下一步一定是 Critic Agent。

我會下這種指令:

使用 Critic Agent,嚴格審查 03_script/script_draft.md,
不要客氣,指出論點、證據、節奏和視覺問題,
更新 agent_flow/06_critic_agent.md。

Critic Agent 在這支片裡指出幾個問題:

  • 目前仍偏流程宣言,缺少實際成果展示
  • 工具案例不能變成 logo 列舉
  • 中段需要具體失敗 montage
  • 必須更清楚說明這不是全自動成片
  • 反方要更尖銳

這一步很有價值。

因為一人製片最危險的地方,就是你沒有人可以挑戰你。

Critic Agent 的角色不是鼓勵你,而是幫你找出影片不成立的地方。


10. 用 Visual Director Agent 建立視覺規則

AI 影片最容易看起來廉價,是因為每個畫面都很漂亮,但整體沒有一致世界觀。

所以我會讓 Visual Director Agent 建立 Visual Bible。

它會定義:

  • 世界觀
  • 色彩
  • 光線
  • 鏡頭語言
  • 場景
  • B-roll 類型
  • 禁止事項

例如這支片的方向是:

  • 深夜個人工作室
  • 螢幕牆
  • 時間軸
  • prompt
  • 分鏡牆
  • Remotion 動畫
  • AI B-roll
  • before / after

我會避免它變成過度賽博龐克、過度霓虹、假大片感。

這一步的目的,是讓 AI 生成素材被導演調度,而不是讓模型自己決定風格。


11. 用 Storyboard Agent 把每顆鏡頭標上功能

分鏡不是把腳本拆成畫面而已。

分鏡要回答一個問題:

這顆鏡頭如果拿掉,觀眾會少理解什麼?

所以我的 Storyboard Agent 會輸出:

  • 時間碼
  • 段落
  • 畫面任務
  • 鏡頭內容
  • 螢幕文字
  • 聲音提示
  • 素材來源
  • 風險

我會讓它寫到:

04_storyboard/storyboard.md

這樣後面做 Remotion、AI 生圖、B-roll、配音、剪輯時,不會變成亂做素材。

每顆鏡頭都有任務。


12. 用 Sound Design Agent 先設計聲音,不只放 BGM

很多 AI 影片最廉價的地方不是畫面,而是聲音。

只放一首 BGM,影片通常不會有專業感。

所以我會讓 Sound Design Agent 先規劃:

  • 哪裡需要低頻壓力
  • 哪裡需要 hit sound
  • 哪裡需要 riser
  • 哪裡要安靜
  • 哪裡要加 click、whoosh、glitch
  • 哪裡要讓旁白停一下

音樂可以用 Suno 之類的工具生成,但它只負責音樂床。

真正的專業感,還是來自時間軸上的聲音設計。


13. 接到 Render Pipeline:配音、Remotion、字幕、粗剪

前面那些步驟都還是文件流程。

真正變成影片,是從 render pipeline 開始。

我這支片後來接了幾個部分:

  1. 用 TTS 生成旁白
  2. 把旁白放進 Remotion
  3. 用 Remotion 做 rough cut
  4. 每一幕根據旁白長度對齊
  5. 加入 motion graphics、轉場、scorecard、流程圖
  6. 在 Studio 裡逐幕檢查

我不會每次都先 render 出成品。

比較有效的方式是直接進 Remotion Studio 看:

npm run dev

然後針對每一幕改:

第八幕影片對齊聲音長度。
第九幕提到 AI video 和 Remotion 時加兩個 logo badge。
第十四幕加入完整的 1% scorecard。

這就是 Codex App 和 Remotion 搭配起來很有用的地方。

我可以像導演在盯剪輯一樣,用自然語言逐幕調整畫面。


14. 加入 1% Scorecard:發行前的品質閘門

最後,我不會只問:「這支片做完了嗎?」

我會問:「這支片有沒有達到作品標準?」

所以我在專案裡放了一張 1% Video Essay Scorecard

它檢查 12 項:

指標 問題
Hook 前 5 秒有沒有強衝突?
敘事 觀眾是否知道為什麼要繼續看?
Thesis 影片是否有可爭辯的核心命題?
證據 主張是否有來源、案例或合理推論支撐?
視覺 是否有統一風格,而不是素材拼貼?
鏡頭 每顆鏡頭是否有功能?
節奏 每 3-7 秒是否有注意力變化?
聲音 是否有音效設計,而不是只有 BGM?
字幕 字幕是否服務理解與情緒?
資訊 是否有新的觀點,而不是工具介紹?
商業 是否能延伸成服務、模板、課程、案例或下一集?
記憶點 看完後觀眾能不能記住一句話?

規則很簡單:

  • 平均 4.5 以上,才進 final export
  • 平均 4.0 到 4.4,可以發布,但至少修最低 2 項
  • 任一項低於 3,不要發布,回到對應 Agent

這張表的重點不是追求完美。

重點是避免自己用 AI 更快產出更多普通東西。


15. 最後才做 Distribution:標題、縮圖、短影音、社群文

影片不是上傳才開始發行。

發行應該在製作流程裡就開始設計。

我的 Distribution Agent 會輸出:

  • YouTube 標題候選
  • 推薦標題
  • 縮圖文字
  • 縮圖構圖方向
  • YouTube description
  • Chapters
  • Shorts / Reels / TikTok 切片
  • LinkedIn 貼文
  • Threads / X 貼文
  • 14 天推廣節奏

例如這支片的標題方向有:

我能不能用 AI 做出一間一人製片廠?
AI 會拍片了,但你會導演嗎?
不是工具問題,是你沒有導演感

縮圖方向則會圍繞:

一人製片廠?
AI 會拍片了
但你會導演嗎?
70% 自動化
不是工具問題

這一步很重要。

因為一人製片廠不是只做影片,也要設計影片如何被點開、被理解、被切片、被延伸。


我的實際 Codex App 指令範本

如果你想複製這套流程,可以從這些指令開始。

建立工作台

幫我建立一個一人 video essay 製作系統。
第一支 pilot 題目是:{你的題目}
請建立資料夾、prompt templates、研究文件、腳本文件、分鏡表、發行計畫。

產出題目

使用 Topic Agent,根據 agent_flow/00_brief.md,
產出 10 個 video essay 題目,
寫到 agent_flow/01_topic_agent.md。

從選題後開始跑完整流程

我選第 {題號} 題。
執行 automation/run_full_flow.md,
從 Research Agent 開始,不要重跑 Topic Agent。

審稿

使用 Critic Agent,嚴格審查 03_script/script_draft.md,
指出開場、論點、證據、節奏和視覺化問題。
不要客氣。

轉成分鏡

使用 Storyboard Agent,根據新版腳本和 Visual Bible,
更新 04_storyboard/storyboard.md。
每一顆鏡頭都要有功能,不要只做漂亮畫面。

做成 Remotion rough cut

根據 04_storyboard/storyboard.md 和旁白音檔,
用 Remotion 製作 rough cut。
先不用 render,我會進 Studio 看。

發行前審查

使用 Edit Review Agent,
根據 rough cut 筆記和 1% scorecard,
審查節奏、鏡頭功能、聲音、字幕和記憶點。

這套系統真正幫我解決什麼?

它不是讓我不用思考。

它是逼我把思考變成流程。

以前做一支影片,很多判斷會散在腦中:

  • 這個題目好像可以
  • 這段好像有點拖
  • 這個畫面好像不錯
  • 這個標題好像能點

但這些「好像」很難複製。

Codex App 幫我做的,是把這些模糊判斷變成可以反覆執行的文件和檢查點:

  • brief
  • research dossier
  • thesis
  • story structure
  • script
  • storyboard
  • sound design plan
  • scorecard
  • release plan

每支影片都用同一套問題逼自己。

這才是一人製片廠的核心。


結論:一人製片廠不是更少判斷,而是更多判斷集中到你身上

做完這套流程後,我更確定一件事:

AI 不會自動讓普通人變成導演。

它只會把原本分散在很多人身上的工作,壓縮到一個人面前。

所以未來的差距,不只是誰會用最新工具。

真正的差距會是:

  • 誰有觀點
  • 誰有標準
  • 誰懂鏡頭功能
  • 誰懂聲音節奏
  • 誰能做取捨
  • 誰能把 AI 當成可被導演調度的素材工廠

我現在做的這套 Codex App 工作流,還不是終點。

它是第一個可重複的底座。

下一步,我會把它接到更完整的 render pipeline:旁白、字幕、Remotion 場景、AI B-roll、音效、剪輯和輸出。

到那時候,問題就不是「我會不會用 AI」。

問題會變成:

我能不能像一個導演一樣,指揮這些 AI?