Computer vision 计算机视觉

Computer vision 计算机视觉,computer-vision,text-extraction,Computer Vision,Text Extraction,我是计算机视觉新手。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python兼容 首先,您必须了解文本识别器是如何工作的 1. have-text-region is extracted from the image 2. we recognize text for each region 3. Combine the text of all regions to form final result Tesseract本身在步骤2中工作得非常好。但对于步骤1,它只适用于文

我是计算机视觉新手。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python兼容

首先,您必须了解文本识别器是如何工作的

1. have-text-region is extracted from the image
2. we recognize text for each region
3. Combine the text of all regions to form final result
Tesseract本身在步骤2中工作得非常好。但对于步骤1,它只适用于文档中的文本。在计算机视觉中,第一步称为“场景文本检测”。所以你的下一步是找到一些好的代码,或者可以做“场景文本检测”的论文

如果你想学习和阅读报纸,这里有一个列表。但在我看来,图像中的文本是黑色背景上的白色文本,因此简单的颜色阈值可以轻松解决步骤1


希望有帮助

欢迎来到SO!恐怕你现在的问题很宽泛,而且你还要把十几个问题放在一个问题里。请看一看。虽然这是一本烦人的读物,但它包含了合理的建议。另外请注意,要求图书馆推荐的问题被认为是离题的,很可能会被关闭。顺便说一句,欢迎进入投票级别;-)