Python 基于TensorFlow的文本识别与检测

Python 基于TensorFlow的文本识别与检测,python,tensorflow,deep-learning,text-classification,text-recognition,Python,Tensorflow,Deep Learning,Text Classification,Text Recognition,我正在做一个文本识别项目。 我已经使用TensorFlow构建了一个分类器来预测数字,但我想通过使用文本定位和文本分割来实现一个更复杂的文本识别算法,将每个字符分开,但我没有找到算法中这些部分的实现 那么,你知道一些算法/实现/技巧吗?我使用TensorFlow对文本进行定位,并在自然场景图片中进行文本分割,实际上对体育图片记分板中的文本进行定位和分割 非常感谢您的帮助。要对页面上的元素(如文本和图像的段落)进行分组,您可以使用一些聚类算法,和/或对一些树框进行斑点检测 您可以使用Radon变换

我正在做一个文本识别项目。 我已经使用TensorFlow构建了一个分类器来预测数字,但我想通过使用文本定位和文本分割来实现一个更复杂的文本识别算法,将每个字符分开,但我没有找到算法中这些部分的实现

那么,你知道一些算法/实现/技巧吗?我使用TensorFlow对文本进行定位,并在自然场景图片中进行文本分割,实际上对体育图片记分板中的文本进行定位和分割


非常感谢您的帮助。

要对页面上的元素(如文本和图像的段落)进行分组,您可以使用一些聚类算法,和/或对一些树框进行斑点检测

您可以使用Radon变换来识别线条并检测扫描页面的倾斜

我认为对于字符分离,你将不得不处理字体。一些多项式匹配/拟合之类的。现在这是一个非常疯狂的猜测,不要当真。 但类似的方法可以让你在同一步中把字符从行中取出并识别出来

至于识别,一旦你有了一个角色,就有了一个很好的三角技巧,可以将角色的角度与数据库中存储的角度进行比较。 书法也很好

我不是一个网页分割的专家,但我似乎我在路上成为一个专家。只是在做一个项目,包括它。 给我一个月的时间,我会告诉你更多D

无论如何,你应该去阅读Tesseract代码,看看惠普和谷歌是如何做到这一点的。它会给你很好的主意


祝你好运

这是一个非常宽泛的问题,答案可能是肯定的。我个人在玩弄使用鼠标/触摸屏手势识别算法进行OCR的想法。你也做过类似的事情吗?我没说你什么都不做,只是等我在一个月内把愚蠢的页面分出来。我知道,就示例代码而言,网络上有比没有更多的东西,但是有一些关于OCR的好书,正如我所说的,tesseract是GPL。我希望你最终会帮助我,而不是反过来。但没关系。我迟早要处理页面分割。让我们看看谁将首先解决这个问题。@Dalen您的项目有什么结果吗?我也在做一个涉及文本检测和分割的项目。对不起,我被其他一些同样复杂的项目分散了注意力。但正如我所说,我迟早会这么做的。通过提供更好的准备图像,我实现了tesseract识别的一些改进,但页面分割我还没有触及,不是真的。除了内置的。我的问题是,我试图对连环画和图画小说进行识别。这是一个混乱和完全疯狂的概念。所有疯狂的酷酷字体、背景和其他东西。真让我难受。你试过Radon吗?你试过tesseract代码吗?看,我有所有这些疯狂的语音气球来提取它们,并将它们从图形中分离出来,然后过滤掉什么是背景和什么文本,然后试着识别一种字体,这种字体可能是专为那本条子/书发明的。很明显,我是个疯子,以为我一个人能做到。但我还是要试试D@SarahM:P.S.哎哟,我忘了在上面的评论中提到你,所以这一条只是为了确保你得到它们。