java ocr linux_Linux Tesseract-OCR安装与训练样本
安装对应的lib (install the libs)sudoapt-getinstallautoconfautomakelibtoolsudoapt-getinstalllibpng12-devsudoapt-getinstalllibjpeg62-devsudoapt-getinstalllibtiff4-devsudoapt-getinstallzlib1g...
安装对应的lib (install the libs)
sudo apt-get install autoconf automake libtool
sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install zlib1g-dev
确保安装下面的lib:
sudo apt-get install gcc
sudo apt-get install g++
sudo apt-get install automake
安装Leptonica:
$wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz
$tar zxvf leptonica-1.69.tar.gz
cd到其目录下:
./configure && make && sudo make install
安装 Tesseract:
$wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
$tar zxvf tesseract-ocr-3.02.02.tar.gz
cd到其目录下:
./configure && make && sudo make install
Install 后 需要sudo ldconfig
使用训练包的话需要先安装英文包
设置 TESSDATA_PREFIX 语言包所在的目录(语言包在Win下训练好后直接导入tessdata目录下即可)
export TESSDATA_PREFIX=/usr/tesseract-ocr/
2.训练样本
需要注意的是最后五个包的重命名
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)