php tesseract,PHP ocr:用Tesseract OCR进行文字识别
系统环境:centos7安装tesseract:yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/sudo rpm --import https://build.opensuse.org/projects/home:Alexande
系统环境:centos7
安装tesseract:
yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/
sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
yum install tesseract
yum install tesseract-langpack-deu
安装php拓展包:
composer require thiagoalessio/tesseract_ocr
注意,php需要开启system函数才能正常使用拓展
使用如下:
require ('./vendor/autoload.php');
use thiagoalessio\TesseractOCR\TesseractOCR;
$ret = (new TesseractOCR('./text.png'))
->run();
var_dump($ret);
这边,我的测试图片是:

输出效果如下:

这时候,是无法识别中文的,我们安装下英文,中文繁体,中文简体 识别库。
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/4.00/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
其他语言包可以到这边查找:
https://tesseract-ocr.github.io/tessdoc/Data-Files#data-files-for-version-400-november-29-2016
然后移动库到我的安装目录,也就是
cp/mv *.traineddata /usr/local/share/tessdata/
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)