PaddleOCR二次训练，训练属于自己的数据集（linux）

1.1源码安装下载，找到PPOCRlabel.py文件，并运行它。3.点击查看标注内容是否正确，若正确则点击，不正确进行步骤四。下载成功后，运行PPOCRLabel文件，将弹出来标注软件。4.若不正确选择对应的框进行重新标注，并输入正确识别结果。2.自动标注，若有不对可进行人为修改。标注好后，需进行点击生成这三个文件。（需要很多的库，报错就安装）

m0_67592509

697人浏览 · 2024-09-18 13:17:09

m0_67592509 · 2024-09-18 13:17:09 发布

一：制作数据

1.标注工具的下载

标注工具的安装共两种方式：

1.1源码安装下载，找到PPOCRlabel.py文件，并运行它。

python PPOCRlabel.py

（需要很多的库，报错就安装）

1.2.直接安装

pip install PPOCRlabel

2.标注

下载成功后，运行PPOCRLabel文件，将弹出来标注软件

1.打开文件

2.自动标注，若有不对可进行人为修改

3.点击查看标注内容是否正确，若正确则点击，不正确进行步骤四

4.若不正确选择对应的框进行重新标注，并输入正确识别结果。

标注好后，需进行点击生成这三个文件

3.划分数据集

最后应该生成以下文件

之后进行数据集的划分

python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath 1/1#这个是刚刚生成数据的训练集，生成目录为默认目录，则为PPOCRLabel上一级目录

生成目录为下图： det是用来训练文字检测的数据集，rec是用来训练文字识别的数据集

二：训练模型

需要训练两个模型，分别为定位和识别，先训练定位模型，再进行识别模型的训练。

Ⅰ：定位

1.下载模型

从官网下载模型（网站）

PaddleOCR/doc/doc_ch/models_list.md at release/2.7 · PaddlePaddle/PaddleOCR · GitHub

之后下载此文件，添加到PaddleOCR-release-2.7（选择自己的源码）

2.配置文件

因为选择的是上面的文件，配置文件则需要下面的配置文件

修改下列基本参数

use_gpu:是否应用gpu

wpoch_num：训练的周期

save_model_dir:保存模型的路径

pretrained_model：预训练模型的路径

data_dir：训练图片的路径

label_file_list：训练图片txt的路径

data_dir:val图片的路径

label_file_list：val txt的路径

3.开始训练

python tools/train.py -c configs/det/ch_ppocr_v2.0/ch_det_res18_db_v2.0.yml

训练成功后生成最好的的模型会存放到上面所写的保存路径里面

4.进行预测

python tools/infer_det.py -c configs/det/ch_ppocr_v2.0/ch_det_res18_db_v2.0.yml -o Global.pretrained_model=/home/gicom/WY/PaddleOCR-release-2.7/out_model/det/best_model/model.pdparams  #训练最好结果模型的路径Global.infer_img=/home/gicom/WY/gicomocr/result/1#预测图片的文件夹路径

预测后在默认文件夹保存

Ⅱ：识别

此步骤和定位步骤相似

1.下载模型

PaddleOCR/doc/doc_ch/models_list.md at release/2.7 · PaddlePaddle/PaddleOCR · GitHub

2.配置文件

配置里面的内容和定位一致，这里不加赘述

3.开始训练

python tools/train.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec.yml #ch_PP-OCRv3_rec.yml的路径

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。