Image processing 如何创建视频OCR?

Image processing 如何创建视频OCR?,image-processing,ocr,Image Processing,Ocr,我在win form C#申请中工作。 应用程序从视频设备(如电视/摄像机或输入视频文件)抓取图像。 然后处理它并将其保存在文本文档中 我的问题是,“如何创建数字视频OCR?” 请向我推荐任何教程/链接/源代码。从OCR部分和相机方法的开始。祝你好运。因为视频OCR仍然是一个活跃的研究课题,你可能需要付出更多的努力来开发自己的视频OCR引擎。基本上可以基于视频场景剪切检测、文本检测和视频剪切识别来构建视频OCR框架 使用场景切分检测作为预处理步骤,以降低计算成本;然后定位视频剪切帧中文本内容的位

我在win form C#申请中工作。 应用程序从视频设备(如电视/摄像机或输入视频文件)抓取图像。 然后处理它并将其保存在文本文档中

我的问题是,“如何创建数字视频OCR?”


请向我推荐任何教程/链接/源代码。

从OCR部分和相机方法的开始。祝你好运。

因为视频OCR仍然是一个活跃的研究课题,你可能需要付出更多的努力来开发自己的视频OCR引擎。基本上可以基于视频场景剪切检测、文本检测和视频剪切识别来构建视频OCR框架

使用场景切分检测作为预处理步骤,以降低计算成本;然后定位视频剪切帧中文本内容的位置和边界;使用适当的文本分割和二值化技术从背景中分离文本像素。最后应用打印OCR引擎得到文本结果


如果您只处理少量视频数据,可以使用mashape上的。

如果您或其他人正在处理此问题,我发现这非常有用。

基本上,将视频转换为静止图像,对这些图像进行处理以优化OCR结果,然后对每个图像进行OCR。

之前的一些工作可能与此相关:

  • 翻书视频流中的OCR()
  • 用于视频索引的视频OCR,Sankirti S.和P.M.Kamade()
  • 视频OCR API()

谷歌云提供视频OCR API

您可以通过视频直接调用此API。它将返回文本边界框及其与视频关联的时间戳