如何將PDF檔案轉換為文字並上傳至ChatGPT O1

大家好！今天我們要來聊聊如何將PDF檔案中的文字提取出來，並將其上傳到ChatGPT O1，這樣你就可以更有效地利用資料了！

為什麼要提取PDF文字？

在使用ChatGPT O1時，我們不能直接上傳PDF檔案，但可以將文字提取出來，這樣就能在對話框中使用了！

以下是兩個簡單的方法來提取PDF中的文字：

準備工作
- 確保你的電腦上安裝了NVIDIA顯示卡和至少8G的RAM。
- 下載並安裝Docker。
- 安裝VSCode並在擴展中安裝Docker。
安裝MinerU
- 打開Windows PowerShell，運行以下命令來安裝MinerU：
```
docker pull [MinerU的Docker映像]
```
- 等待安裝完成。
將PDF檔案傳輸到Docker
- 使用以下命令將PDF檔案複製到Docker容器中：
```
docker cp C:\path\to\LOLM.PDF container_id:/home/
```
執行文字提取
- 進入容器並運行提取命令：
```
docker exec -it container_id bash
Magic PDF-P /home/LOLM.PDF -O /home/ -L CH
```
- 提取完成後，檢查生成的Markdown檔案，並複製文字。

這兩種方法都可以有效地將PDF中的文字提取出來，讓你能夠在ChatGPT O1中進行更深入的分析！如果你覺得這篇文章對你有幫助，歡迎訂閱我的頻道，並打開小鈴鐺，以便第一時間獲取最新的技術文章！

謝謝大家的支持！