OPENCV+PYTHON 文字识别（重点图像透视变换）

# Author：Winter Liu is coming!import cv2 as cvimport numpy as npimport pytesseract# 预处理，高斯滤波（用处不大），4次开操作# 过滤轮廓唯一def contour_demo(img):gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)gray =...

huang714

1245人浏览 · 2020-04-20 13:26:41

huang714 · 2020-04-20 13:26:41 发布

# Author：Winter Liu is coming!
import cv2 as cv
import numpy as np
import pytesseract

# 预处理，高斯滤波（用处不大），4次开操作
# 过滤轮廓唯一
def contour_demo(img):
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
gray = cv.GaussianBlur(gray, (5, 5), 1)
ref, thresh = cv.threshold(gray, 127, 255, cv.THRESH_BINARY)
kernel = np.ones((9, 9), np.uint8)
thresh = cv.morphologyEx(thresh, cv.MORPH_OPEN, kernel, iterations=4)
contours, hierachy = cv.findContours(thresh, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
print(len(contours))
return contours

def capture(img):
contours = contour_demo(img)
# 轮廓唯一，以后可以扩展
contour = contours[0]
# 求周长，可在后面的转换中使用周长和比例
print(cv.arcLength(contour,True))
img_copy = img.copy()
# 使用approxPolyDP，将轮廓转换为直线，22为精度（越高越低），TRUE为闭合
approx = cv.approxPolyDP(contour, 22, True)
# print(approx.shape)
# print(approx)
# cv.drawContours(img_copy, [approx], -1, (255, 0, 0), 15)
n = []
# 生产四个角的坐标点
for x, y in zip(approx[:, 0, 0], approx[:, 0, 1]):
n.append((x, y))
p1 = np.array(n, dtype=np.float32)
# 对应点
p2 = np.array([(0, 0), (0, 1500), (1000, 1500), (1000, 0)], dtype=np.float32)
M = cv.getPerspectiveTransform(p1, p2) # 变换矩阵
# 使用透视变换
result = cv.warpPerspective(img_copy, M, (0, 0))
# 重新截取
result = result[:1501, :1001]
cv.imwrite(r"C:\PycharmProjects\OpenCV\pic\ocr.png", result)
return result

# 图像识别代码，需要预先下载安装开源工具包 pytesseract，配置环境变量
# pip install pytesseract
# 修改“C:\Python\Python37\Lib\site-packages\pytesseract\pytesseract.py”中“cmd”为绝对路径
def ocr_img(img):
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 图像清晰度越高结果越精确，时间更长
text = pytesseract.image_to_string(gray)
print(text)

src = cv.imread(r"C:\PycharmProjects\OpenCV\pic\page.jpg")
res = capture(src)
ocr_img(res)
cv.waitKey(0)
cv.destroyAllWindows()

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r

魔乐社区

提升Angular2-HN性能的7个实用技巧：让新闻加载速度飞起来

Angular2-HN是一款基于Angular构建的Progressive Hacker News客户端，专为追求高效新闻浏览体验的用户设计。本文将分享7个实用技巧，帮助你优化Angular2-HN的性能，让新闻加载速度显著提升，带来更流畅的阅读体验。## 1. 启用Service Worker缓存关键资源Service Worker是提升Angular应用性能的强大工具，它可以在后台缓存