python tesseract-ocr 图文识别

一,先进行Tesserocr安装下载

1,先点击进入下面的百度网盘

链接: https://pan.baidu.com/s/1G5vZO2B4Mxx5JaiQtfIqCw 提取码: mp1u

打开百度网盘之后知道下面这两个文件

tesserocr-2.4.0-cp37-cp37m-win_amd64.whl

tesseract-ocr-w64-setup-v5.0.0.20190623.exe

如果上面百度网盘打不开,可以尝试打开下面的百度网盘:

链接:https://pan.baidu.com/s/1-a69qU0aFu8_IlYzy0QgMQ 提取码:yd7i

链接:https://pan.baidu.com/s/1Tt9vRsbk7uX9VVTGb36OiA 提取码:1yhh

2,待下载完毕之后运行tesseract-ocr-w64-setup-v5.0.0.20190623.exe文件,

我的是安装在F:\Tesseract-OCR,一直next下去。

需要选择的选项,看下图。其中语言要选择简体中文,安装时会下载语言包,可能等待一段时间。

d61bd594f6efb87ba72914f6b6559552.png

ef7b110bca6e684217f57770cb7e6943.png

安装完成之后的目录如下:

我的tesseract-ocr是安装在F:\Tesseract-OCR,

e3eac32e375765915642ee76e9b1fefb.png

下面开始最重要的步骤:

将F:\Tesseract-OCR里面的 tessdata 整个文件夹一起复制到python安装目录下面

fa4d1cb29ec06aa9d4e8af3c2c3a2d2e.png

把上面网盘下载的另一个文件(tesserocr-2.4.0-cp37-cp37m-win_amd64.whl)也复制到python安装目录下面

a8eab3fda6572742f1f80c3dcb255421.png

91f4305c0a19b823f4a85dd9b083f0b8.png

3,开始创建tesseract-ocr环境变量

将“F:\Tesseract-OCR”添加到环境变量中。如图:

8318034c764ee4c3ddae008efef8b9c3.png

增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径F:\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中。

ae5cc78e3fd9f46325cd77d1877a8308.png

打开命令终端,输入:tesseract -v,可以看到版本信息

2518ab8fd8748cbfec69cb2b8d0944dce6f.jpg

ea09090d1c43da5ecc8b5b9e981c5087.png

用命令tesseract --list-langs来查看Tesseract-OCR支持语言。

6cdbb17d22e5e8ab3b715d30e8e57e1a.png

二,用pip或者pycharm 安装 tesseract 和 pytesseract

1,用pip安装

其实只需安装tesseract,默认pytesseract会随着tesseract一起安装的

执行pip install tesseract

如果pytesseract没有自动安装的话,可以再次主动安装pytesseract

2,用pycharm安装

9853dd71690c658278c3f36f0c4dc4a4.png

aa496ba039f647ed845fb7166c1f946d.png

最后pytesseract,tesseract,tesserocr 都安装成功之之后,显示如下:

633813015c82ccaf42e180efb4f2800e.png

如果官网下载很慢的话也可以在百度网盘下载 https://pan.baidu.com/s/1G5vZO2B4Mxx5JaiQtfIqCw 提取码: mp1u

2031c90cdf19983ab27a762a72673ab8.png

四,测试一下识别效果:

用下面三张图片进行识别

b973046d74ee99cf8a0468ed1422d350.png

代码如下:

importpytesseractfrom PIL importImageimporttesserocr

im=Image.open('ying_shu.png')print(pytesseract.image_to_string(im))

im1=Image.open('ying_jianti.png')print(pytesseract.image_to_string(im1,lang='chi_sim'))

im2=Image.open('fanti.png')print(pytesseract.image_to_string(im2,lang='chi_tra'))

识别结果如下:

ecacd79474a1c89a6dee61fbdc5ed8f9.png

可以看到识别结果存在一定的错误,这就是识别率的问题,后期再进行优化

4b027f86ac1a7a6e175aebc90e585623.png

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐