人工数据合成

人工数据合成主要有两个方法。

一、从零开始创建数据

二、已有数据集,进行扩充

可以对图片等添加噪声,或者图片变形、引入失真等。

三、上限分析

例如照片OCR,对于一个系统由几个部分组成。
在这里插入图片描述
首先是求出整体系统的准确率,然后逐步让每个部分表现最好,得出此时的准确率,这样就能发现我改进谁,谁就能最大限度的提升整体系统性能。

可以看出,1-2提升了17,2-3提升了1,3-4提升了10。因此文本检测和字符识别能够较好的提升系统性能,而不需要花费很大精力去完善字符切割。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐