還記得我之前介紹過一個超強的開源專案 ebook2audiobook 嗎?它可以幫你把手邊的電子書(PDF、EPUB)直接轉換成有聲書。之前我們分享過 Windows 和 Mac 的基礎安裝,但最近有網友回報了一個問題:
「阿發,我在 Windows 上明明選了 GPU 加速,為什麼跑起來還是用 CPU?速度好慢啊!」
沒錯!原本的安裝方式在 Windows 上確實會遇到無法正確呼叫 NVIDIA 顯卡的問題。所以今天這篇就是**「除錯特輯」**,我要教大家如何解決這個 bug,成功讓你的顯卡動起來,享受飆速轉檔的快感!🚀
準備工作
在開始修改之前,請確認你已經完成以下準備:
- 安裝 VS Code:我們需要用它來修改程式碼設定檔(官網下載安裝即可)。
- 更新 NVIDIA 驅動程式:請到 GeForce Experience 或 NVIDIA 官網,確認你的顯卡驅動已經更新到最新版本,確保 CUDA 支援正常。
- 下載 ebook2audiobook 專案:如果你還沒下載,請先到 GitHub 下載專案包(建議放在 D 槽或其他非系統槽),並執行 Windows 的自動安裝指令。
關鍵步驟:解決 GPU 無法調用問題
如果你發現安裝完後,介面上雖然選了 GPU,但後台還是顯示 CPU 在跑,請跟著我做以下兩個關鍵修正:
Step 1:重新安裝 PyTorch (CUDA 版本)
原本的安裝包在 Windows 上可能預設抓到了不支援 GPU 的 PyTorch 版本。我們需要手動覆蓋它。
- 開啟你的終端機 (CMD 或 PowerShell),進入 ebook2audiobook 的專案資料夾。
- 輸入特定的 PyTorch 安裝指令(這串指令通常很長,用來指定 CUDA 12.x 或 11.x 的版本)。
- 註:詳細指令請參考影片下方資訊欄或 GitHub 討論串,確保版本與你的顯卡相符。
Step 2:修改 requirements.txt
這一步最重要!有一個套件卡住了我們的運作。
- 使用 VS Code 開啟 ebook2audiobook 專案資料夾。
- 找到名為
requirements.txt的檔案。 - 找到大約 第 28 行,看到
deepspeed這個套件名稱。 - 直接刪除這一行(delete 掉 deepspeed)。
- 按下
Ctrl + S存檔。
完成這個動作後,我們再重新執行一次安裝依賴的指令,讓環境重新整理一下。
Step 3:啟動與驗證
修正完畢後,我們就可以來驗收成果啦!
- 執行啟動指令(通常是
run_windows.bat或類似指令)。 - 看到終端機跑完後,打開瀏覽器輸入
http://127.0.0.1:7860。 - 介面設定:
- 上傳你的電子書。
- Voice Reference:建議上傳一段中文的人聲錄音檔(WAV 格式),讓 AI 進行聲音複製(Voice Cloning),這樣讀出來的中文會更自然。
- Output Format:可以選 MP3 或 WAV。
- 按下 Convert:這時候觀察你的後台終端機,你會發現它終於開始吃 GPU 的效能了!轉檔速度絕對比用 CPU 快上好幾倍!
檔案在哪裡?
轉檔完成後,檔案會自動儲存在專案資料夾下的路徑中:
ebook2audiobook > audiobooks > gui > host
裡面就會看到剛剛熱騰騰轉好的有聲書檔案囉!
總結
雖然開源專案常常會有一些環境設定的小坑,但只要透過這兩個簡單的步驟(更新 PyTorch、移除 deepspeed),就能完美解決 Windows 用戶的痛點。強烈建議有 NVIDIA 顯卡的朋友一定要做這個修正,不然你的顯卡就白買啦!
如果今天的教學幫你解決了問題,歡迎在底下留言告訴我!
喜歡我的影片別忘了按讚、訂閱、分享,並開啟小鈴鐺,這樣才不會錯過最新的軟體教學喔!我是 AFA,我們下次見!👋