pillow、pytesseract-ocr、pytesseract的安装和中文的识别

安装pytesseract库，必须先安装其依赖的PIL及tesseract-ocr，其中PIL为图像处理库，而后面的tesseract-ocr则为google的ocr识别引擎。一、安装PIL（换源）pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pillow二、安装Tesseract-OCR它的git：https://git...

王崇卫

2271人浏览 · 2019-11-04 19:25:32

王崇卫 · 2019-11-04 19:25:32 发布

安装pytesseract库，必须先安装其依赖的PIL及tesseract-ocr，其中PIL为图像处理库，而后面的tesseract-ocr则为google的ocr识别引擎。

一、安装PIL（换源）

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pillow
在这里插入图片描述

二、安装Tesseract-OCR

它的git：https://github.com/tesseract-ocr/tesseract
直接下载地址：https://digi.bib.uni-mannheim.de/tesseract/
找的最新版本：
在这里插入图片描述

我添加了math 跟chinese（因为是国内网络的原因吧，下载都失败，所以不用选择，后面自己下载后，添加到相应目录就好）

在这里插入图片描述

安装后需要配置环境变量

在这里插入图片描述

在cmd下测试
tesseract -v

三、安装pytesseract(换源)

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytesseract
在这里插入图片描述

重新开机后测试

在这里插入图片描述

importpytesseract
fromPILimportImage
image=Image.open("G:\\Python\\1.png")
print(image)
vcode=pytesseract.image_to_string(image)
print(vcode)

添加中文的识别库

github：
https://github.com/tesseract-ocr
在这里插入图片描述
第一个就好

将下载的.traineddata放到这个安装的这个目录下：

在这里插入图片描述

测试带代码

import pytesseract
from PIL import Image
image = Image.open("G:\\Python\\ch_sim.png")
print (image)
vcode = pytesseract.image_to_string(image, lang='chi_sim')
print (vcode)

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r