Image processing 如何创建视频OCR？_Image Processing_Ocr

Image processing 如何创建视频OCR？

image-processing

Image processing 如何创建视频OCR？,image-processing,ocr,Image Processing,Ocr,我在win form C#申请中工作。应用程序从视频设备（如电视/摄像机或输入视频文件）抓取图像。然后处理它并将其保存在文本文档中我的问题是，“如何创建数字视频OCR？” 请向我推荐任何教程/链接/源代码。从OCR部分和相机方法的开始。祝你好运。因为视频OCR仍然是一个活跃的研究课题，你可能需要付出更多的努力来开发自己的视频OCR引擎。基本上可以基于视频场景剪切检测、文本检测和视频剪切识别来构建视频OCR框架使用场景切分检测作为预处理步骤，以降低计算成本；然后定位视频剪切帧中文本内容的位

我在win form C#申请中工作。应用程序从视频设备（如电视/摄像机或输入视频文件）抓取图像。然后处理它并将其保存在文本文档中

我的问题是，“如何创建数字视频OCR？”

请向我推荐任何教程/链接/源代码。

从OCR部分和相机方法的开始。祝你好运。

因为视频OCR仍然是一个活跃的研究课题，你可能需要付出更多的努力来开发自己的视频OCR引擎。基本上可以基于视频场景剪切检测、文本检测和视频剪切识别来构建视频OCR框架

使用场景切分检测作为预处理步骤，以降低计算成本；然后定位视频剪切帧中文本内容的位置和边界；使用适当的文本分割和二值化技术从背景中分离文本像素。最后应用打印OCR引擎得到文本结果

如果您只处理少量视频数据，可以使用mashape上的。

如果您或其他人正在处理此问题，我发现这非常有用。

基本上，将视频转换为静止图像，对这些图像进行处理以优化OCR结果，然后对每个图像进行OCR。

之前的一些工作可能与此相关：

翻书视频流中的OCR（）
用于视频索引的视频OCR，Sankirti S.和P.M.Kamade（）
视频OCR API（）

谷歌云提供视频OCR API

您可以通过视频直接调用此API。它将返回文本边界框及其与视频关联的时间戳