javacv文字识别系列:

javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别

javaCV文字识别之2:视频文字识别和视频提取字幕文字字符

前言

上一章我们实现了图片的文字识别和提取,本章基于javacv中的tesserac 和ffmpeg实现视频文字识别和提取

javacv中包含ffmpeg和tesserac两个库以及tesserac的依赖库leptonica。

读取视频帧javacv已经帮我们封装好了,直接就可以读取到视频帧,麻烦的是,测试的时候发现javacv设置像素格式不起效果,所以我们只能通过BufferedImage进行转换后才能进行图片文字识别,性能上肯定会有折扣,后面我会放出基于ffmpeg的解码并转换为rgb像素后提供给tesserac进行识别。

那么,就让我们开始吧。

注意:由于我们是每一帧都进行识别,而且视频播放和识别是相同线程,会阻塞,所以视频播放速度会很慢。

实现功能

1、视频读取

2、视频帧获取

3、视频帧转换为java的BuffredImage图片

4、图片转像素

5、使用像素数据进行tesserac ocr文字识别

完整阅读本章:https://eguid.blog.csdn.net/article/details/106044521

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐