Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/10.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Image 有没有好的图像文本定位算法?_Image_Algorithm_Image Processing_Text_Localization - Fatal编程技术网

Image 有没有好的图像文本定位算法?

Image 有没有好的图像文本定位算法?,image,algorithm,image-processing,text,localization,Image,Algorithm,Image Processing,Text,Localization,我想问你是否知道有什么好的文本定位算法可以检测图像中的候选文本(用于我的OCR项目) 本质上,在“应用”这个算法之后,我希望能够获得具有候选字符的区域(边界框),例如 我试图找到一些我可能会用到的东西,但即使我找到了一些东西,也很可能是在一篇非常难的论文中,需要应用非常高的数学。我已经遇到过MSER()或梯度向量流方法,但这两种方法对我来说都很难(虽然我在数学方面了解很多,但我仍然很难弄清楚)这些方法可能会给你一些提示: 我不知道有什么简单的算法可以做到这一点。但是,我们正在使用名为le

我想问你是否知道有什么好的文本定位算法可以检测图像中的候选文本(用于我的OCR项目)

本质上,在“应用”这个算法之后,我希望能够获得具有候选字符的区域(边界框),例如


我试图找到一些我可能会用到的东西,但即使我找到了一些东西,也很可能是在一篇非常难的论文中,需要应用非常高的数学。我已经遇到过MSER()或梯度向量流方法,但这两种方法对我来说都很难(虽然我在数学方面了解很多,但我仍然很难弄清楚)

这些方法可能会给你一些提示:


  • 我不知道有什么简单的算法可以做到这一点。但是,我们正在使用名为leadtools的第三方工具包来执行类似的行为。我知道它可以自动找到文本区域并识别它们。有关详细信息,您可以查看此帮助主题,其中包含一个代码段:

    此外,由于图像中的颜色会降低OCR识别过程的准确性和性能,因此您可以在OCR之前对图像进行一些图像处理。

    您可以使用Opencv3.0“场景文本检测”功能。它基于“用于场景文本检测的特定于类的极值区域”。它还有示例代码

    您可以在以下网址找到它们:

    [1]

    [2]

    论文:

    [Neumann12]Neumann L.,Matas J.:实时场景文本定位与识别,CVPR 2012。该论文可在网上查阅

    [Neumann11]Neumann L.,Matas J.:使用有效修剪穷举搜索在现实世界图像中进行文本定位,ICDAR 2011。该论文可在网上查阅

    [Gomez13]Gomez L.和Karatzas D.:从自然场景中提取多脚本文本,ICDAR 2013。该论文可在网上查阅

    [Gomez14]Gomez L.和Karatzas D.:一种用于多脚本和任意面向场景文本提取的快速分层方法,arXiv:1407.7504[cs.CV]。该论文可在网上查阅