我如何用 Codex App 建立一間「一人製片廠」

這不是一篇「AI 工具清單」。這是一篇我如何把 Codex App 變成一人影視製作工作台的實作紀錄。

以前，一支高完成度影片背後通常不是一個人。

你需要導演、編劇、攝影、美術、剪輯、聲音設計、動態設計，最後還要有人負責標題、封面、短影音和發行。

但現在問題變得很奇怪：如果 AI 可以幫我研究、寫稿、分鏡、生成 B-roll、做旁白、做字幕、做動畫，甚至幫我拆短影音，那一個人能不能真的逼近一間小型製片廠？

這就是我這支影片想測試的事。

我的結論不是「AI 可以一鍵拍完一支好片」。剛好相反。

真正可行的一人製片廠，不是全自動成片機，而是一套混合系統：

AI 負責壓縮製作勞動
Codex App 負責建立可重複的工作流
Remotion 負責穩定控制動畫、字卡、圖表和字幕
人負責導演判斷、剪輯判斷、聲音判斷和最終取捨

一句話說完：

AI 可以壓縮製作勞動，但不能壓縮導演判斷。

下面是我實際用 Codex App 建立「一人製片廠」的流程。

1. 先不要急著裝一堆 AI 工具

很多人開始做 AI 影片，第一反應是去研究最新工具：哪個模型畫質最好、哪個可以圖生影片、哪個可以做配音、哪個可以做字幕。

但我這次反過來。

我不是先問：「我要用哪些工具？」

我先問：「一支影片到底需要哪些判斷？」

因為影片不是一串素材。影片是一連串判斷：

題目值不值得拍？
前 5 秒要用什麼衝突抓住觀眾？
哪一段需要圖表？
哪一段需要 B-roll？
哪一顆鏡頭是建立世界觀？
哪一顆鏡頭只是裝飾？
哪裡要加速？
哪裡要停下來？
聲音在哪裡要有壓力？
觀眾看完後記得哪一句話？

所以我在 Codex App 裡建立的不是「工具箱」，而是「製作工作台」。

2. 建立專案資料夾：讓每一步都有地方沉澱

我先請 Codex App 建立一個 video essay 專案資料夾。

我用的指令大概是：

幫我建立一個 video essay 製作工作台。
題目是：我能不能用 AI 做出一間「一人製片廠」？
請建立資料夾、prompt templates、研究文件、腳本文件、分鏡表、發行計畫。

接著我把專案整理成這樣：

ai-video-ad-agency-workbench/
  agent_flow/
    00_brief.md
    01_topic_agent.md
    02_research_agent.md
    03_thesis_agent.md
    04_story_core_agent.md
    05_script_agent.md
    06_critic_agent.md
    07_visual_director_agent.md
    08_storyboard_agent.md
    09_sound_design_agent.md
    10_edit_review_agent.md
    11_distribution_agent.md
    prompts/
  01_research/
  02_story/
  03_script/
  04_storyboard/
  05_release/
  06_assets/
  07_exports/
  08_checklists/
  automation/
  render_pipeline/

這個結構很重要。

因為 Codex App 最強的地方，不是一次回答你一個問題，而是可以在同一個 workspace 裡讀取、修改、延續檔案。

也就是說，我不用每次都重新解釋我的影片在做什麼。

每個 Agent 的輸出，都會變成下一個 Agent 的輸入。

3. 先寫 Brief：讓所有 Agent 有同一個上下文

每支影片開始，我先建立 agent_flow/00_brief.md。

這份 brief 不是給觀眾看的，是給整個製作系統看的。

它要回答：

這支片的題目是什麼？
目標觀眾是誰？
影片不是什麼？
核心論點是什麼？
視覺風格是什麼？
第一版要做到哪裡？
哪些事情暫時不做？

這次我的題目是：

我能不能用 AI 做出一間「一人製片廠」？

核心論點是：

AI 可以讓一個人完成過去小團隊的許多製作勞動，
但它不能讓一個缺乏判斷力的人自動變成製片廠。

這一步的重點是：不要讓 Codex 只是在幫你「產文案」。

你要讓它進入一個固定製作上下文。

4. 用 Topic Agent 先產題目，讓人做選擇

我不建議一開始就全自動跑完整支片。

比較好的方式是：先讓 Codex 產題目，然後人來選。

我會下這種指令：

使用 Topic Agent，根據 agent_flow/00_brief.md，
產出 10 個 video essay 題目，
寫到 agent_flow/01_topic_agent.md。

為什麼要停在這一步？

因為選題是人類判斷的第一個關卡。

AI 可以給你很多題目，但它不知道哪一個最符合你的頻道方向、觀眾期待、商業價值和你現在真的能做出來的能力。

所以我的流程不是「AI 自動決定題目」，而是：

AI 產出 10 個方向
我選其中一題
Codex 再從 Research Agent 開始往下跑

例如：

我選第 2 題。執行 automation/run_full_flow.md，
從 Research Agent 開始，不要重跑 Topic Agent。

5. 用 Research Agent 把題目變成資料包

選題之後，下一步不是寫稿。

下一步是研究。

Research Agent 會整理：

核心背景
重要案例
時間線
反方觀點
可視覺化素材
來源清單
需要查核的主張

我會讓它把結果寫到：

agent_flow/02_research_agent.md
01_research/research_dossier.md
01_research/source_log.md

這樣做有兩個好處。

第一，腳本不會只剩空泛觀點。

第二，之後要寫 YouTube description、部落格、來源補充時，不用回頭翻聊天紀錄。

所有研究都沉澱在專案裡。

6. 用 Thesis Agent 把研究收斂成一句話

研究之後，我會讓 Thesis Agent 做一件事：把資料收斂成核心命題。

這一步非常重要。

因為 video essay 最怕變成「我查到很多資料，所以全部講一遍」。

好的影片要有一條脊椎。

這支片的脊椎是：

AI 可以壓縮製作勞動，但不能壓縮導演判斷。

這句話會決定後面所有東西：

開場怎麼設計
哪些資料要保留
哪些工具只是背景
哪些畫面要做
結尾要留下什麼記憶點

我會用這種指令：

使用 Thesis Agent，根據 agent_flow/02_research_agent.md，
產出核心論點與章節架構，
寫到 agent_flow/03_thesis_agent.md。

7. 用 Story Core Agent 建立衝突和情緒曲線

有論點還不夠。

影片不是論文。影片需要衝突、節奏和情緒。

所以我會再跑 Story Core Agent，讓它建立：

Hook
問題
測試
拆解
結論
情緒曲線
每段畫面任務
觀眾記憶點

這支片最後變成這樣的結構：

一個人能不能變成製片廠？
AI 會生成影片，但不會替你成為導演
一支影片其實是很多判斷疊在一起
AI 現在能壓縮哪些工作？
為什麼還不能全自動？
我的最小可行一人製片廠
真正的門檻是作品標準
答案是可以，但條件很硬

這一步是在避免影片變成工具列表。

我不是在介紹 AI 影片工具。

我是在回答一個問題：

一個人加上 AI，到底能不能逼近一間小型製片廠？

8. 用 Script Agent 寫旁白稿

故事結構確定後，才進入腳本。

我的指令是：

使用 Script Agent，根據 agent_flow/03_thesis_agent.md
和 agent_flow/04_story_core_agent.md，
寫 10-12 分鐘旁白稿，
寫到 03_script/script_draft.md。

這裡有一個關鍵：我不只叫 Codex 寫稿。

我會要求它每段都要有：

旁白內容
畫面提示
需要查核的地方
節奏功能

例如這支片裡，腳本不只是說「AI 很強」，而是會要求畫面顯示：

傳統製作角色卡片快速出現，
壓縮到一張深夜工作桌；
螢幕上同時有 brief、script、storyboard、
Remotion preview、AI B-roll、timeline。

也就是說，腳本一開始就要服務影像。

9. 用 Critic Agent 嚴格審稿

我不會讓 Script Agent 寫完就直接進製作。

下一步一定是 Critic Agent。

我會下這種指令：

使用 Critic Agent，嚴格審查 03_script/script_draft.md，
不要客氣，指出論點、證據、節奏和視覺問題，
更新 agent_flow/06_critic_agent.md。

Critic Agent 在這支片裡指出幾個問題：

目前仍偏流程宣言，缺少實際成果展示
工具案例不能變成 logo 列舉
中段需要具體失敗 montage
必須更清楚說明這不是全自動成片
反方要更尖銳

這一步很有價值。

因為一人製片最危險的地方，就是你沒有人可以挑戰你。

Critic Agent 的角色不是鼓勵你，而是幫你找出影片不成立的地方。

10. 用 Visual Director Agent 建立視覺規則

AI 影片最容易看起來廉價，是因為每個畫面都很漂亮，但整體沒有一致世界觀。

所以我會讓 Visual Director Agent 建立 Visual Bible。

它會定義：

世界觀
色彩
光線
鏡頭語言
場景
B-roll 類型
禁止事項

例如這支片的方向是：

深夜個人工作室
螢幕牆
時間軸
prompt
分鏡牆
Remotion 動畫
AI B-roll
before / after

我會避免它變成過度賽博龐克、過度霓虹、假大片感。

這一步的目的，是讓 AI 生成素材被導演調度，而不是讓模型自己決定風格。

11. 用 Storyboard Agent 把每顆鏡頭標上功能

分鏡不是把腳本拆成畫面而已。

分鏡要回答一個問題：

這顆鏡頭如果拿掉，觀眾會少理解什麼？

所以我的 Storyboard Agent 會輸出：

時間碼
段落
畫面任務
鏡頭內容
螢幕文字
聲音提示
素材來源
風險

我會讓它寫到：

04_storyboard/storyboard.md

這樣後面做 Remotion、AI 生圖、B-roll、配音、剪輯時，不會變成亂做素材。

每顆鏡頭都有任務。

12. 用 Sound Design Agent 先設計聲音，不只放 BGM

很多 AI 影片最廉價的地方不是畫面，而是聲音。

只放一首 BGM，影片通常不會有專業感。

所以我會讓 Sound Design Agent 先規劃：

哪裡需要低頻壓力
哪裡需要 hit sound
哪裡需要 riser
哪裡要安靜
哪裡要加 click、whoosh、glitch
哪裡要讓旁白停一下

音樂可以用 Suno 之類的工具生成，但它只負責音樂床。

真正的專業感，還是來自時間軸上的聲音設計。

13. 接到 Render Pipeline：配音、Remotion、字幕、粗剪

前面那些步驟都還是文件流程。

真正變成影片，是從 render pipeline 開始。

我這支片後來接了幾個部分：

用 TTS 生成旁白
把旁白放進 Remotion
用 Remotion 做 rough cut
每一幕根據旁白長度對齊
加入 motion graphics、轉場、scorecard、流程圖
在 Studio 裡逐幕檢查

我不會每次都先 render 出成品。

比較有效的方式是直接進 Remotion Studio 看：

npm run dev

然後針對每一幕改：

第八幕影片對齊聲音長度。

第九幕提到 AI video 和 Remotion 時加兩個 logo badge。

第十四幕加入完整的 1% scorecard。

這就是 Codex App 和 Remotion 搭配起來很有用的地方。

我可以像導演在盯剪輯一樣，用自然語言逐幕調整畫面。

14. 加入 1% Scorecard：發行前的品質閘門

最後，我不會只問：「這支片做完了嗎？」

我會問：「這支片有沒有達到作品標準？」

所以我在專案裡放了一張 1% Video Essay Scorecard。

它檢查 12 項：

指標	問題
Hook	前 5 秒有沒有強衝突？
敘事	觀眾是否知道為什麼要繼續看？
Thesis	影片是否有可爭辯的核心命題？
證據	主張是否有來源、案例或合理推論支撐？
視覺	是否有統一風格，而不是素材拼貼？
鏡頭	每顆鏡頭是否有功能？
節奏	每 3-7 秒是否有注意力變化？
聲音	是否有音效設計，而不是只有 BGM？
字幕	字幕是否服務理解與情緒？
資訊	是否有新的觀點，而不是工具介紹？
商業	是否能延伸成服務、模板、課程、案例或下一集？
記憶點	看完後觀眾能不能記住一句話？

規則很簡單：

平均 4.5 以上，才進 final export
平均 4.0 到 4.4，可以發布，但至少修最低 2 項
任一項低於 3，不要發布，回到對應 Agent

這張表的重點不是追求完美。

重點是避免自己用 AI 更快產出更多普通東西。

15. 最後才做 Distribution：標題、縮圖、短影音、社群文

影片不是上傳才開始發行。

發行應該在製作流程裡就開始設計。

我的 Distribution Agent 會輸出：

YouTube 標題候選
推薦標題
縮圖文字
縮圖構圖方向
YouTube description
Chapters
Shorts / Reels / TikTok 切片
LinkedIn 貼文
Threads / X 貼文
14 天推廣節奏

例如這支片的標題方向有：

我能不能用 AI 做出一間一人製片廠？
AI 會拍片了，但你會導演嗎？
不是工具問題，是你沒有導演感

縮圖方向則會圍繞：

一人製片廠？
AI 會拍片了
但你會導演嗎？
70% 自動化
不是工具問題

這一步很重要。

因為一人製片廠不是只做影片，也要設計影片如何被點開、被理解、被切片、被延伸。

我的實際 Codex App 指令範本

如果你想複製這套流程，可以從這些指令開始。

建立工作台

幫我建立一個一人 video essay 製作系統。
第一支 pilot 題目是：{你的題目}
請建立資料夾、prompt templates、研究文件、腳本文件、分鏡表、發行計畫。

產出題目

使用 Topic Agent，根據 agent_flow/00_brief.md，
產出 10 個 video essay 題目，
寫到 agent_flow/01_topic_agent.md。

從選題後開始跑完整流程

我選第 {題號} 題。
執行 automation/run_full_flow.md，
從 Research Agent 開始，不要重跑 Topic Agent。

審稿

使用 Critic Agent，嚴格審查 03_script/script_draft.md，
指出開場、論點、證據、節奏和視覺化問題。
不要客氣。

轉成分鏡

使用 Storyboard Agent，根據新版腳本和 Visual Bible，
更新 04_storyboard/storyboard.md。
每一顆鏡頭都要有功能，不要只做漂亮畫面。

做成 Remotion rough cut

根據 04_storyboard/storyboard.md 和旁白音檔，
用 Remotion 製作 rough cut。
先不用 render，我會進 Studio 看。

發行前審查

使用 Edit Review Agent，
根據 rough cut 筆記和 1% scorecard，
審查節奏、鏡頭功能、聲音、字幕和記憶點。

這套系統真正幫我解決什麼？

它不是讓我不用思考。

它是逼我把思考變成流程。

以前做一支影片，很多判斷會散在腦中：

這個題目好像可以
這段好像有點拖
這個畫面好像不錯
這個標題好像能點

但這些「好像」很難複製。

Codex App 幫我做的，是把這些模糊判斷變成可以反覆執行的文件和檢查點：

brief
research dossier
thesis
story structure
script
storyboard
sound design plan
scorecard
release plan

每支影片都用同一套問題逼自己。

這才是一人製片廠的核心。

結論：一人製片廠不是更少判斷，而是更多判斷集中到你身上

做完這套流程後，我更確定一件事：

AI 不會自動讓普通人變成導演。

它只會把原本分散在很多人身上的工作，壓縮到一個人面前。

所以未來的差距，不只是誰會用最新工具。

真正的差距會是：

誰有觀點
誰有標準
誰懂鏡頭功能
誰懂聲音節奏
誰能做取捨
誰能把 AI 當成可被導演調度的素材工廠

我現在做的這套 Codex App 工作流，還不是終點。

它是第一個可重複的底座。

下一步，我會把它接到更完整的 render pipeline：旁白、字幕、Remotion 場景、AI B-roll、音效、剪輯和輸出。

到那時候，問題就不是「我會不會用 AI」。

問題會變成：

我能不能像一個導演一樣，指揮這些 AI？

1. 先不要急著裝一堆 AI 工具#

2. 建立專案資料夾：讓每一步都有地方沉澱#

3. 先寫 Brief：讓所有 Agent 有同一個上下文#

4. 用 Topic Agent 先產題目，讓人做選擇#

5. 用 Research Agent 把題目變成資料包#

6. 用 Thesis Agent 把研究收斂成一句話#

7. 用 Story Core Agent 建立衝突和情緒曲線#

8. 用 Script Agent 寫旁白稿#

9. 用 Critic Agent 嚴格審稿#

10. 用 Visual Director Agent 建立視覺規則#

11. 用 Storyboard Agent 把每顆鏡頭標上功能#

12. 用 Sound Design Agent 先設計聲音，不只放 BGM#

13. 接到 Render Pipeline：配音、Remotion、字幕、粗剪#

14. 加入 1% Scorecard：發行前的品質閘門#

15. 最後才做 Distribution：標題、縮圖、短影音、社群文#

我的實際 Codex App 指令範本#

建立工作台#

產出題目#

從選題後開始跑完整流程#

審稿#

轉成分鏡#

做成 Remotion rough cut#

發行前審查#

這套系統真正幫我解決什麼？#

結論：一人製片廠不是更少判斷，而是更多判斷集中到你身上#