Python+百度AI,实现文字识别
python调用摄像头,结合百度AI进行文字识别
·
主要功能:python:打开电脑摄像头,百度AI:文字识别
一、准备工作
python:安装opencv模块
百度AI:登录百度AI官网-->产品服务-->人工智能-->文字识别-->概览-->免费尝鲜-->领取资源
二、python调用摄像头
import cv2 as cv#导入模块cap = cv.VideoCapture(0)#调用摄像头,参数0位电脑内置摄像头 while cap.isOpened():#判断是否打开 M1,M2 = cap.read()#读取图像 cv.imshow("测试用",M2)#显示图像 key = cv.waitKey(1) & 0xFF#按键判断 if key == ord(" "):#按空格键退出循环 break # 释放内存 cv.destroyAllWindows() # 释放摄像头 cap.release()
三、调用百度AI
在文字识别的界面,点击左侧公有云服务-->应用列表,新建一个应用。再点击左侧技术文档,打开页面后,选择HTTP-SDK文档--python语言--快速入门,将代码复制,再进入接口说明,将通用文字识别(标准版)代码复制,示例代码如下所示
from aip import AipOcr """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) """ 读取文件 """ def get_file_content(filePath): with open(filePath, "rb") as fp: return fp.read() image = get_file_content('文件路径') url = "https://www.x.com/sample.jpg" pdf_file = get_file_content('文件路径') # 调用通用文字识别(标准版) res_image = client.basicGeneral(image) res_url = client.basicGeneralUrl(url) res_pdf = client.basicGeneralPdf(pdf_file) print(res_image) print(res_url) print(res_pdf) # 如果有可选参数 options = {} options["language_type"] = "CHN_ENG" options["detect_direction"] = "true" options["detect_language"] = "true" options["probability"] = "true" res_image = client.basicGeneral(image, options) res_url = client.basicGeneralUrl(url, options) res_pdf = client.basicGeneralPdf(pdf_file, options) print(res_image) print(res_url) print(res_pdf)
我们将代码删减后得到如下代码
from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取文件 """
def get_file_content(filePath):
with open(filePath, "rb") as fp:
return fp.read()
image = get_file_content('文件路径')
# 调用通用文字识别(标准版)
res_image = client.basicGeneral(image)
print(res_image)
四、代码整合
import cv2 as cv
from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
cap = cv.VideoCapture(0)
""" 读取文件 """
def get_file_content(filePath):
with open(filePath, "rb") as fp:
return fp.read()
while cap.isOpened():
M1,M2 = cap.read()
cv.imshow("测试用",M2)
key = cv.waitKey(1) & 0xFF#按键判断
if key == ord("s"):#按下s键
cv.imwrite('你的路径',M2)#保存图片
image = get_file_content('上面保存的路径') #获取图片
res_image = client.basicGeneral(image)#识别图片
print(res_image)#输出识别信息
elif key == ord(" "):#空格退出
break
# 释放内存
cv.destroyAllWindows()
# 释放摄像头
cap.release()
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)