重慶分公司,新征程啟航
為企業(yè)提供網(wǎng)站建設(shè)、域名注冊(cè)、服務(wù)器等服務(wù)
為企業(yè)提供網(wǎng)站建設(shè)、域名注冊(cè)、服務(wù)器等服務(wù)
使用Python3怎么獲取圖片文字中的中文?相信很多沒(méi)有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策,為此本文總結(jié)了問(wèn)題出現(xiàn)的原因和解決方法,通過(guò)這篇文章希望你能解決這個(gè)問(wèn)題。
一、運(yùn)行環(huán)境
(1) win10
(2) pycharm
(3) python 3.5
(4) pillow與pytesseract庫(kù)安裝:
pip3 install pillow pip3 install pytesseract
(5) 識(shí)別引擎tesseract-ocr ,下載之后解壓安裝,下載地址:https://www.jb51.net/softs/538925.html
二、 運(yùn)行代碼
# -*- coding: utf-8 -*- from PIL import Image import pytesseract #上面都是導(dǎo)包,只需要下面這一行就能實(shí)現(xiàn)圖片文字識(shí)別 text=pytesseract.image_to_string(Image.open('show.jpg'),lang='chi_sim') #設(shè)置為中文文字的識(shí)別 #text=pytesseract.image_to_string(Image.open('test.png'),lang='eng') #設(shè)置為英文或阿拉伯字母的識(shí)別 print(text)
三、報(bào)錯(cuò)解決
1.FileNotFoundError:[WinError 2]系統(tǒng)找不到指定文件。
解決辦法:
打開(kāi)文件pytesseract.py,找到如下代碼,將tesseract_cmd的值修改為全路徑,再次使用就不會(huì)報(bào)這個(gè)錯(cuò)了。
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
2.pytesseract.pytesseract.TesseractError:(1,'Error opening data file\\Progr
解決辦法:
打開(kāi)文件pytesseract.py,找到image_to_string,指定config的參數(shù),如下:
tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
def image_to_string(image, lang=None, boxes=False, config=tessdata_dir_config):
看完上述內(nèi)容,你們掌握使用Python3怎么獲取圖片文字中的中文的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計(jì)公司行業(yè)資訊頻道,感謝各位的閱讀!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專(zhuān)為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。