2021-11-22 22:40:38|已瀏覽:338次
你一定用過那種“OCR神器”,可以把圖片中的文字提取出來,極大的提高工作效率。
今天,我們就來做一款實時截圖識別的小工具。顧名思義,運行程序時,可以實時的把你截出來的圖片中的文字識別出來。
下次,當你想要復制“百度文庫”中的內容時,不妨試試這個程序。
源碼解析
1)等待用戶截圖import keyboard # 利用截圖軟件(Snipaste)截圖到剪貼板 # 輸入鍵盤的觸發事件 keyboard.wait(hotkey="f1") keyboard.wait(hotkey="ctrl+c") time.sleep(0.1)順便安利一波Snipaste,
必備效率神器
3)修改pytesseract.py文件,將tesseract_cmd指向Tesseract-OCR的tesseract.exe的絕對路徑
import pytesseract from PIL import Image # 法一:利用pytesseract模塊 # 參數一:圖片 # 參數二:簡體中文 text = pytesseract.image_to_string(Image.open("screen.png"), lang='chi_sim') print(text)
來看看效果:import pytesseract
from aip import AipOcr
from PIL import ImageGrab
# 法二:利用百度API
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 讀取圖片
with open("screen.png", 'rb') as f:
image = f.read()
# 調用百度API通用文字識別(高精度版),提取圖片中的內容
text = client.basicAccurate(image)
result = text["words_result"]
for i in result:
print(i["words"])
結果如文章首圖:我的總結
1)等待用戶截圖2)保存截圖到當前目錄3)識別截圖中的文本
其中識別截圖文本,有兩種方法:1)利用 pytesseract 模塊
2)利用百度API接口
本文由培訓無憂網千鋒教育專屬課程顧問整理發布,希望能夠對想學習Python開發培訓的同學有所幫助。更多Python開發培訓課程歡迎關注培訓無憂網Python開發培訓頻道或添加老師微信:15033336050
注:尊重原創文章,轉載請注明出處和鏈接 http://m.dedgn.cn/news-id-4530.html 違者必究!部分文章來源于網絡由培訓無憂網編輯部人員整理發布,內容真實性請自行核實或聯系我們,了解更多相關資訊請關注python培訓頻道查看更多,了解相關專業課程信息您可在線咨詢也可免費申請試課。關注官方微信了解更多:150 3333 6050