如何將PDF檔案轉換為文字並上傳至ChatGPT O1
大家好!今天我們要來聊聊如何將PDF檔案中的文字提取出來,並將其上傳到ChatGPT O1,這樣你就可以更有效地利用資料了!
為什麼要提取PDF文字?
在使用ChatGPT O1時,我們不能直接上傳PDF檔案,但可以將文字提取出來,這樣就能在對話框中使用了!
提取文字的兩種方法
以下是兩個簡單的方法來提取PDF中的文字:
方法一:使用Google Notebook LM
- 打開Google Notebook LM
- 將你的PDF檔案上傳到Notebook LM。
- 點擊檔案,Notebook LM會自動將文字抓取出來。
- 複製抓取的文字,並將其粘貼到ChatGPT O1中。
方法二:使用MinerU程式
-
準備工作
-
安裝MinerU
- 打開Windows PowerShell,運行以下命令來安裝MinerU:
docker pull [MinerU的Docker映像] - 等待安裝完成。
- 打開Windows PowerShell,運行以下命令來安裝MinerU:
-
將PDF檔案傳輸到Docker
- 使用以下命令將PDF檔案複製到Docker容器中:
docker cp C:\path\to\LOLM.PDF container_id:/home/
- 使用以下命令將PDF檔案複製到Docker容器中:
-
執行文字提取
- 進入容器並運行提取命令:
docker exec -it container_id bash Magic PDF-P /home/LOLM.PDF -O /home/ -L CH - 提取完成後,檢查生成的Markdown檔案,並複製文字。
- 進入容器並運行提取命令:
總結
這兩種方法都可以有效地將PDF中的文字提取出來,讓你能夠在ChatGPT O1中進行更深入的分析!如果你覺得這篇文章對你有幫助,歡迎訂閱我的頻道,並打開小鈴鐺,以便第一時間獲取最新的技術文章!
謝謝大家的支持!