如何將PDF檔案轉換為文字並上傳至ChatGPT O1

大家好!今天我們要來聊聊如何將PDF檔案中的文字提取出來,並將其上傳到ChatGPT O1,這樣你就可以更有效地利用資料了!

為什麼要提取PDF文字?

在使用ChatGPT O1時,我們不能直接上傳PDF檔案,但可以將文字提取出來,這樣就能在對話框中使用了!

提取文字的兩種方法

以下是兩個簡單的方法來提取PDF中的文字:

方法一:使用Google Notebook LM

  1. 打開Google Notebook LM
  2. 將你的PDF檔案上傳到Notebook LM。
  3. 點擊檔案,Notebook LM會自動將文字抓取出來。
  4. 複製抓取的文字,並將其粘貼到ChatGPT O1中。

方法二:使用MinerU程式

  1. 準備工作

    • 確保你的電腦上安裝了NVIDIA顯示卡和至少8G的RAM。
    • 下載並安裝Docker
    • 安裝VSCode並在擴展中安裝Docker。
  2. 安裝MinerU

    • 打開Windows PowerShell,運行以下命令來安裝MinerU:
      docker pull [MinerU的Docker映像]
      
    • 等待安裝完成。
  3. 將PDF檔案傳輸到Docker

    • 使用以下命令將PDF檔案複製到Docker容器中:
      docker cp C:\path\to\LOLM.PDF container_id:/home/
      
  4. 執行文字提取

    • 進入容器並運行提取命令:
      docker exec -it container_id bash
      Magic PDF-P /home/LOLM.PDF -O /home/ -L CH
      
    • 提取完成後,檢查生成的Markdown檔案,並複製文字。

總結

這兩種方法都可以有效地將PDF中的文字提取出來,讓你能夠在ChatGPT O1中進行更深入的分析!如果你覺得這篇文章對你有幫助,歡迎訂閱我的頻道,並打開小鈴鐺,以便第一時間獲取最新的技術文章!

謝謝大家的支持!