文本检测和文本识别可以分成两个部分; 目前的深度学习方案也有很多端到端的系统。

本质也是计算机视觉中的一种物体检测和识别分支;

-- 传统方法用手工特征提取检测是否文本区域;

    之后通过传统的机器学习方法,例如 支持向量机 SVM等方法 将特征分类,识别字符。

-- 深度学习方法,用卷积神经网络提取特征,之后检测; 或分类。

截至2021年11月,目前的一篇综述论文详述了各个类别的方法。

参考论文:

Long S, He X, Yao C. Scene text detection and recognition: The deep learning era[J]. International Journal of Computer Vision, 2021, 129(1): 161-184.

下载链接:SceneTextDetectionandRecognition_TheDeepLearningEra.pdf-互联网文档类资源-CSDN下载

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐