這不是一篇「AI 工具清單」。這是一篇我如何把 Codex App 變成一人影視製作工作台的實作紀錄。
以前,一支高完成度影片背後通常不是一個人。
你需要導演、編劇、攝影、美術、剪輯、聲音設計、動態設計,最後還要有人負責標題、封面、短影音和發行。
但現在問題變得很奇怪:如果 AI 可以幫我研究、寫稿、分鏡、生成 B-roll、做旁白、做字幕、做動畫,甚至幫我拆短影音,那一個人能不能真的逼近一間小型製片廠?
這就是我這支影片想測試的事。
我的結論不是「AI 可以一鍵拍完一支好片」。剛好相反。
真正可行的一人製片廠,不是全自動成片機,而是一套混合系統:
- AI 負責壓縮製作勞動
- Codex App 負責建立可重複的工作流
- Remotion 負責穩定控制動畫、字卡、圖表和字幕
- 人負責導演判斷、剪輯判斷、聲音判斷和最終取捨
一句話說完:
AI 可以壓縮製作勞動,但不能壓縮導演判斷。
下面是我實際用 Codex App 建立「一人製片廠」的流程。
1. 先不要急著裝一堆 AI 工具
很多人開始做 AI 影片,第一反應是去研究最新工具:哪個模型畫質最好、哪個可以圖生影片、哪個可以做配音、哪個可以做字幕。
但我這次反過來。
我不是先問:「我要用哪些工具?」
我先問:「一支影片到底需要哪些判斷?」
因為影片不是一串素材。影片是一連串判斷:
- 題目值不值得拍?
- 前 5 秒要用什麼衝突抓住觀眾?
- 哪一段需要圖表?
- 哪一段需要 B-roll?
- 哪一顆鏡頭是建立世界觀?
- 哪一顆鏡頭只是裝飾?
- 哪裡要加速?
- 哪裡要停下來?
- 聲音在哪裡要有壓力?
- 觀眾看完後記得哪一句話?
所以我在 Codex App 裡建立的不是「工具箱」,而是「製作工作台」。
2. 建立專案資料夾:讓每一步都有地方沉澱
我先請 Codex App 建立一個 video essay 專案資料夾。
我用的指令大概是:
幫我建立一個 video essay 製作工作台。
題目是:我能不能用 AI 做出一間「一人製片廠」?
請建立資料夾、prompt templates、研究文件、腳本文件、分鏡表、發行計畫。
接著我把專案整理成這樣:
ai-video-ad-agency-workbench/
agent_flow/
00_brief.md
01_topic_agent.md
02_research_agent.md
03_thesis_agent.md
04_story_core_agent.md
05_script_agent.md
06_critic_agent.md
07_visual_director_agent.md
08_storyboard_agent.md
09_sound_design_agent.md
10_edit_review_agent.md
11_distribution_agent.md
prompts/
01_research/
02_story/
03_script/
04_storyboard/
05_release/
06_assets/
07_exports/
08_checklists/
automation/
render_pipeline/
這個結構很重要。
因為 Codex App 最強的地方,不是一次回答你一個問題,而是可以在同一個 workspace 裡讀取、修改、延續檔案。
也就是說,我不用每次都重新解釋我的影片在做什麼。
每個 Agent 的輸出,都會變成下一個 Agent 的輸入。
3. 先寫 Brief:讓所有 Agent 有同一個上下文
每支影片開始,我先建立 agent_flow/00_brief.md。
這份 brief 不是給觀眾看的,是給整個製作系統看的。
它要回答:
- 這支片的題目是什麼?
- 目標觀眾是誰?
- 影片不是什麼?
- 核心論點是什麼?
- 視覺風格是什麼?
- 第一版要做到哪裡?
- 哪些事情暫時不做?
這次我的題目是:
我能不能用 AI 做出一間「一人製片廠」?
核心論點是:
AI 可以讓一個人完成過去小團隊的許多製作勞動,
但它不能讓一個缺乏判斷力的人自動變成製片廠。
這一步的重點是:不要讓 Codex 只是在幫你「產文案」。
你要讓它進入一個固定製作上下文。
4. 用 Topic Agent 先產題目,讓人做選擇
我不建議一開始就全自動跑完整支片。
比較好的方式是:先讓 Codex 產題目,然後人來選。
我會下這種指令:
使用 Topic Agent,根據 agent_flow/00_brief.md,
產出 10 個 video essay 題目,
寫到 agent_flow/01_topic_agent.md。
為什麼要停在這一步?
因為選題是人類判斷的第一個關卡。
AI 可以給你很多題目,但它不知道哪一個最符合你的頻道方向、觀眾期待、商業價值和你現在真的能做出來的能力。
所以我的流程不是「AI 自動決定題目」,而是:
- AI 產出 10 個方向
- 我選其中一題
- Codex 再從 Research Agent 開始往下跑
例如:
我選第 2 題。執行 automation/run_full_flow.md,
從 Research Agent 開始,不要重跑 Topic Agent。
5. 用 Research Agent 把題目變成資料包
選題之後,下一步不是寫稿。
下一步是研究。
Research Agent 會整理:
- 核心背景
- 重要案例
- 時間線
- 反方觀點
- 可視覺化素材
- 來源清單
- 需要查核的主張
我會讓它把結果寫到:
agent_flow/02_research_agent.md
01_research/research_dossier.md
01_research/source_log.md
這樣做有兩個好處。
第一,腳本不會只剩空泛觀點。
第二,之後要寫 YouTube description、部落格、來源補充時,不用回頭翻聊天紀錄。
所有研究都沉澱在專案裡。
6. 用 Thesis Agent 把研究收斂成一句話
研究之後,我會讓 Thesis Agent 做一件事:把資料收斂成核心命題。
這一步非常重要。
因為 video essay 最怕變成「我查到很多資料,所以全部講一遍」。
好的影片要有一條脊椎。
這支片的脊椎是:
AI 可以壓縮製作勞動,但不能壓縮導演判斷。
這句話會決定後面所有東西:
- 開場怎麼設計
- 哪些資料要保留
- 哪些工具只是背景
- 哪些畫面要做
- 結尾要留下什麼記憶點
我會用這種指令:
使用 Thesis Agent,根據 agent_flow/02_research_agent.md,
產出核心論點與章節架構,
寫到 agent_flow/03_thesis_agent.md。
7. 用 Story Core Agent 建立衝突和情緒曲線
有論點還不夠。
影片不是論文。影片需要衝突、節奏和情緒。
所以我會再跑 Story Core Agent,讓它建立:
- Hook
- 問題
- 測試
- 拆解
- 結論
- 情緒曲線
- 每段畫面任務
- 觀眾記憶點
這支片最後變成這樣的結構:
- 一個人能不能變成製片廠?
- AI 會生成影片,但不會替你成為導演
- 一支影片其實是很多判斷疊在一起
- AI 現在能壓縮哪些工作?
- 為什麼還不能全自動?
- 我的最小可行一人製片廠
- 真正的門檻是作品標準
- 答案是可以,但條件很硬
這一步是在避免影片變成工具列表。
我不是在介紹 AI 影片工具。
我是在回答一個問題:
一個人加上 AI,到底能不能逼近一間小型製片廠?
8. 用 Script Agent 寫旁白稿
故事結構確定後,才進入腳本。
我的指令是:
使用 Script Agent,根據 agent_flow/03_thesis_agent.md
和 agent_flow/04_story_core_agent.md,
寫 10-12 分鐘旁白稿,
寫到 03_script/script_draft.md。
這裡有一個關鍵:我不只叫 Codex 寫稿。
我會要求它每段都要有:
- 旁白內容
- 畫面提示
- 需要查核的地方
- 節奏功能
例如這支片裡,腳本不只是說「AI 很強」,而是會要求畫面顯示:
傳統製作角色卡片快速出現,
壓縮到一張深夜工作桌;
螢幕上同時有 brief、script、storyboard、
Remotion preview、AI B-roll、timeline。
也就是說,腳本一開始就要服務影像。
9. 用 Critic Agent 嚴格審稿
我不會讓 Script Agent 寫完就直接進製作。
下一步一定是 Critic Agent。
我會下這種指令:
使用 Critic Agent,嚴格審查 03_script/script_draft.md,
不要客氣,指出論點、證據、節奏和視覺問題,
更新 agent_flow/06_critic_agent.md。
Critic Agent 在這支片裡指出幾個問題:
- 目前仍偏流程宣言,缺少實際成果展示
- 工具案例不能變成 logo 列舉
- 中段需要具體失敗 montage
- 必須更清楚說明這不是全自動成片
- 反方要更尖銳
這一步很有價值。
因為一人製片最危險的地方,就是你沒有人可以挑戰你。
Critic Agent 的角色不是鼓勵你,而是幫你找出影片不成立的地方。
10. 用 Visual Director Agent 建立視覺規則
AI 影片最容易看起來廉價,是因為每個畫面都很漂亮,但整體沒有一致世界觀。
所以我會讓 Visual Director Agent 建立 Visual Bible。
它會定義:
- 世界觀
- 色彩
- 光線
- 鏡頭語言
- 場景
- B-roll 類型
- 禁止事項
例如這支片的方向是:
- 深夜個人工作室
- 螢幕牆
- 時間軸
- prompt
- 分鏡牆
- Remotion 動畫
- AI B-roll
- before / after
我會避免它變成過度賽博龐克、過度霓虹、假大片感。
這一步的目的,是讓 AI 生成素材被導演調度,而不是讓模型自己決定風格。
11. 用 Storyboard Agent 把每顆鏡頭標上功能
分鏡不是把腳本拆成畫面而已。
分鏡要回答一個問題:
這顆鏡頭如果拿掉,觀眾會少理解什麼?
所以我的 Storyboard Agent 會輸出:
- 時間碼
- 段落
- 畫面任務
- 鏡頭內容
- 螢幕文字
- 聲音提示
- 素材來源
- 風險
我會讓它寫到:
04_storyboard/storyboard.md
這樣後面做 Remotion、AI 生圖、B-roll、配音、剪輯時,不會變成亂做素材。
每顆鏡頭都有任務。
12. 用 Sound Design Agent 先設計聲音,不只放 BGM
很多 AI 影片最廉價的地方不是畫面,而是聲音。
只放一首 BGM,影片通常不會有專業感。
所以我會讓 Sound Design Agent 先規劃:
- 哪裡需要低頻壓力
- 哪裡需要 hit sound
- 哪裡需要 riser
- 哪裡要安靜
- 哪裡要加 click、whoosh、glitch
- 哪裡要讓旁白停一下
音樂可以用 Suno 之類的工具生成,但它只負責音樂床。
真正的專業感,還是來自時間軸上的聲音設計。
13. 接到 Render Pipeline:配音、Remotion、字幕、粗剪
前面那些步驟都還是文件流程。
真正變成影片,是從 render pipeline 開始。
我這支片後來接了幾個部分:
- 用 TTS 生成旁白
- 把旁白放進 Remotion
- 用 Remotion 做 rough cut
- 每一幕根據旁白長度對齊
- 加入 motion graphics、轉場、scorecard、流程圖
- 在 Studio 裡逐幕檢查
我不會每次都先 render 出成品。
比較有效的方式是直接進 Remotion Studio 看:
npm run dev
然後針對每一幕改:
第八幕影片對齊聲音長度。
第九幕提到 AI video 和 Remotion 時加兩個 logo badge。
第十四幕加入完整的 1% scorecard。
這就是 Codex App 和 Remotion 搭配起來很有用的地方。
我可以像導演在盯剪輯一樣,用自然語言逐幕調整畫面。
14. 加入 1% Scorecard:發行前的品質閘門
最後,我不會只問:「這支片做完了嗎?」
我會問:「這支片有沒有達到作品標準?」
所以我在專案裡放了一張 1% Video Essay Scorecard。
它檢查 12 項:
| 指標 | 問題 |
|---|---|
| Hook | 前 5 秒有沒有強衝突? |
| 敘事 | 觀眾是否知道為什麼要繼續看? |
| Thesis | 影片是否有可爭辯的核心命題? |
| 證據 | 主張是否有來源、案例或合理推論支撐? |
| 視覺 | 是否有統一風格,而不是素材拼貼? |
| 鏡頭 | 每顆鏡頭是否有功能? |
| 節奏 | 每 3-7 秒是否有注意力變化? |
| 聲音 | 是否有音效設計,而不是只有 BGM? |
| 字幕 | 字幕是否服務理解與情緒? |
| 資訊 | 是否有新的觀點,而不是工具介紹? |
| 商業 | 是否能延伸成服務、模板、課程、案例或下一集? |
| 記憶點 | 看完後觀眾能不能記住一句話? |
規則很簡單:
- 平均 4.5 以上,才進 final export
- 平均 4.0 到 4.4,可以發布,但至少修最低 2 項
- 任一項低於 3,不要發布,回到對應 Agent
這張表的重點不是追求完美。
重點是避免自己用 AI 更快產出更多普通東西。
15. 最後才做 Distribution:標題、縮圖、短影音、社群文
影片不是上傳才開始發行。
發行應該在製作流程裡就開始設計。
我的 Distribution Agent 會輸出:
- YouTube 標題候選
- 推薦標題
- 縮圖文字
- 縮圖構圖方向
- YouTube description
- Chapters
- Shorts / Reels / TikTok 切片
- LinkedIn 貼文
- Threads / X 貼文
- 14 天推廣節奏
例如這支片的標題方向有:
我能不能用 AI 做出一間一人製片廠?
AI 會拍片了,但你會導演嗎?
不是工具問題,是你沒有導演感
縮圖方向則會圍繞:
一人製片廠?
AI 會拍片了
但你會導演嗎?
70% 自動化
不是工具問題
這一步很重要。
因為一人製片廠不是只做影片,也要設計影片如何被點開、被理解、被切片、被延伸。
我的實際 Codex App 指令範本
如果你想複製這套流程,可以從這些指令開始。
建立工作台
幫我建立一個一人 video essay 製作系統。
第一支 pilot 題目是:{你的題目}
請建立資料夾、prompt templates、研究文件、腳本文件、分鏡表、發行計畫。
產出題目
使用 Topic Agent,根據 agent_flow/00_brief.md,
產出 10 個 video essay 題目,
寫到 agent_flow/01_topic_agent.md。
從選題後開始跑完整流程
我選第 {題號} 題。
執行 automation/run_full_flow.md,
從 Research Agent 開始,不要重跑 Topic Agent。
審稿
使用 Critic Agent,嚴格審查 03_script/script_draft.md,
指出開場、論點、證據、節奏和視覺化問題。
不要客氣。
轉成分鏡
使用 Storyboard Agent,根據新版腳本和 Visual Bible,
更新 04_storyboard/storyboard.md。
每一顆鏡頭都要有功能,不要只做漂亮畫面。
做成 Remotion rough cut
根據 04_storyboard/storyboard.md 和旁白音檔,
用 Remotion 製作 rough cut。
先不用 render,我會進 Studio 看。
發行前審查
使用 Edit Review Agent,
根據 rough cut 筆記和 1% scorecard,
審查節奏、鏡頭功能、聲音、字幕和記憶點。
這套系統真正幫我解決什麼?
它不是讓我不用思考。
它是逼我把思考變成流程。
以前做一支影片,很多判斷會散在腦中:
- 這個題目好像可以
- 這段好像有點拖
- 這個畫面好像不錯
- 這個標題好像能點
但這些「好像」很難複製。
Codex App 幫我做的,是把這些模糊判斷變成可以反覆執行的文件和檢查點:
- brief
- research dossier
- thesis
- story structure
- script
- storyboard
- sound design plan
- scorecard
- release plan
每支影片都用同一套問題逼自己。
這才是一人製片廠的核心。
結論:一人製片廠不是更少判斷,而是更多判斷集中到你身上
做完這套流程後,我更確定一件事:
AI 不會自動讓普通人變成導演。
它只會把原本分散在很多人身上的工作,壓縮到一個人面前。
所以未來的差距,不只是誰會用最新工具。
真正的差距會是:
- 誰有觀點
- 誰有標準
- 誰懂鏡頭功能
- 誰懂聲音節奏
- 誰能做取捨
- 誰能把 AI 當成可被導演調度的素材工廠
我現在做的這套 Codex App 工作流,還不是終點。
它是第一個可重複的底座。
下一步,我會把它接到更完整的 render pipeline:旁白、字幕、Remotion 場景、AI B-roll、音效、剪輯和輸出。
到那時候,問題就不是「我會不會用 AI」。
問題會變成:
我能不能像一個導演一樣,指揮這些 AI?