還記得我之前介紹過一個超強的開源專案 ebook2audiobook 嗎?它可以幫你把手邊的電子書(PDF、EPUB)直接轉換成有聲書。之前我們分享過 Windows 和 Mac 的基礎安裝,但最近有網友回報了一個問題:

「阿發,我在 Windows 上明明選了 GPU 加速,為什麼跑起來還是用 CPU?速度好慢啊!」

沒錯!原本的安裝方式在 Windows 上確實會遇到無法正確呼叫 NVIDIA 顯卡的問題。所以今天這篇就是**「除錯特輯」**,我要教大家如何解決這個 bug,成功讓你的顯卡動起來,享受飆速轉檔的快感!🚀


準備工作

在開始修改之前,請確認你已經完成以下準備:

  1. 安裝 VS Code:我們需要用它來修改程式碼設定檔(官網下載安裝即可)。
  2. 更新 NVIDIA 驅動程式:請到 GeForce Experience 或 NVIDIA 官網,確認你的顯卡驅動已經更新到最新版本,確保 CUDA 支援正常。
  3. 下載 ebook2audiobook 專案:如果你還沒下載,請先到 GitHub 下載專案包(建議放在 D 槽或其他非系統槽),並執行 Windows 的自動安裝指令。

關鍵步驟:解決 GPU 無法調用問題

如果你發現安裝完後,介面上雖然選了 GPU,但後台還是顯示 CPU 在跑,請跟著我做以下兩個關鍵修正:

Step 1:重新安裝 PyTorch (CUDA 版本)

原本的安裝包在 Windows 上可能預設抓到了不支援 GPU 的 PyTorch 版本。我們需要手動覆蓋它。

  1. 開啟你的終端機 (CMD 或 PowerShell),進入 ebook2audiobook 的專案資料夾。
  2. 輸入特定的 PyTorch 安裝指令(這串指令通常很長,用來指定 CUDA 12.x 或 11.x 的版本)。
    • 註:詳細指令請參考影片下方資訊欄或 GitHub 討論串,確保版本與你的顯卡相符。

Step 2:修改 requirements.txt

這一步最重要!有一個套件卡住了我們的運作。

  1. 使用 VS Code 開啟 ebook2audiobook 專案資料夾。
  2. 找到名為 requirements.txt 的檔案。
  3. 找到大約 第 28 行,看到 deepspeed 這個套件名稱。
  4. 直接刪除這一行(delete 掉 deepspeed)。
  5. 按下 Ctrl + S 存檔。

完成這個動作後,我們再重新執行一次安裝依賴的指令,讓環境重新整理一下。


Step 3:啟動與驗證

修正完畢後,我們就可以來驗收成果啦!

  1. 執行啟動指令(通常是 run_windows.bat 或類似指令)。
  2. 看到終端機跑完後,打開瀏覽器輸入 http://127.0.0.1:7860
  3. 介面設定
    • 上傳你的電子書。
    • Voice Reference:建議上傳一段中文的人聲錄音檔(WAV 格式),讓 AI 進行聲音複製(Voice Cloning),這樣讀出來的中文會更自然。
    • Output Format:可以選 MP3 或 WAV。
  4. 按下 Convert:這時候觀察你的後台終端機,你會發現它終於開始吃 GPU 的效能了!轉檔速度絕對比用 CPU 快上好幾倍!

檔案在哪裡?

轉檔完成後,檔案會自動儲存在專案資料夾下的路徑中: ebook2audiobook > audiobooks > gui > host

裡面就會看到剛剛熱騰騰轉好的有聲書檔案囉!


總結

雖然開源專案常常會有一些環境設定的小坑,但只要透過這兩個簡單的步驟(更新 PyTorch、移除 deepspeed),就能完美解決 Windows 用戶的痛點。強烈建議有 NVIDIA 顯卡的朋友一定要做這個修正,不然你的顯卡就白買啦!

如果今天的教學幫你解決了問題,歡迎在底下留言告訴我!

喜歡我的影片別忘了按讚、訂閱、分享,並開啟小鈴鐺,這樣才不會錯過最新的軟體教學喔!我是 AFA,我們下次見!👋