GUI的基本模块:选择图片,识别图片,还有重置

点击选择图片

点击识别图片

点击重置,所有的信息被删除

识别的基本思路:建立识别库,然后把需要识别的图片和识别库的图片对比,最后根据对比的结果输出,把结果输出到界面,同时保存到txt文件中。

关于建立识别库,就是建立了汉字的图片。

数据库的数据要求保证每个图片的格式大小一致,我们建立了一个模板文件,14个中文字符都保存在里面,

对于导入的图片,考虑到我们要提取的信息出版社一般在书的下方,为了减少误判,我们把图片人为裁剪一部分,

对图片进行灰度处理,裁剪,同时采用灰度阈值,去除像素小于30的目标点,

对于提取出来的信息,还需要分段识别信号,采用了等间隔分段的放发,提取出了7个子图片,

针对提取出来的图片和自己建立的数据库,做对比,相关系数最高的,我们认为是该文字,

(网上的方法,我直接截图了)

代码实现:

comp=zeros(1,num_letras);

for n=1:num_letras

sem=sum(sum(abs(double(~templates{1,n})-double(imagn))));

comp(n)=sem;

end

vd=find(comp==max(comp));

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐