在使用Paddle-OCR 图片文字识别提取时,显示置信度会影响文本的阅读感受,如何取消显示置信度,让结果直接给出纯文本呢?

首先,要得到识别提取的结果;

import paddlehub as hub
import cv2

img_path = "../Resources/test.png"

ocr = hub.Module(name="ch_pp-ocrv3", enable_mkldnn=True)  
result = ocr.recognize_text(images=[cv2.imread(img_path)])

然后,在得到的result的基础上,提取text信息到新列表;

texts = [item["text"] for item in result[0]["data"]]

 最后,合并文本,调整格式;

final_text = "\n".join(texts)
print(final_text)

即可得到文本。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐