Computer vision 计算机视觉_Computer Vision_Text Extraction

Computer vision 计算机视觉

computer-vision

Computer vision 计算机视觉,computer-vision,text-extraction,Computer Vision,Text Extraction,我是计算机视觉新手。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python兼容首先，您必须了解文本识别器是如何工作的 1. have-text-region is extracted from the image 2. we recognize text for each region 3. Combine the text of all regions to form final result Tesseract本身在步骤2中工作得非常好。但对于步骤1，它只适用于文

我是计算机视觉新手。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python兼容

首先，您必须了解文本识别器是如何工作的

1. have-text-region is extracted from the image
2. we recognize text for each region
3. Combine the text of all regions to form final result

Tesseract本身在步骤2中工作得非常好。但对于步骤1，它只适用于文档中的文本。在计算机视觉中，第一步称为“场景文本检测”。所以你的下一步是找到一些好的代码，或者可以做“场景文本检测”的论文

如果你想学习和阅读报纸，这里有一个列表。但在我看来，图像中的文本是黑色背景上的白色文本，因此简单的颜色阈值可以轻松解决步骤1

希望有帮助

欢迎来到SO！恐怕你现在的问题很宽泛，而且你还要把十几个问题放在一个问题里。请看一看。虽然这是一本烦人的读物，但它包含了合理的建议。另外请注意，要求图书馆推荐的问题被认为是离题的，很可能会被关闭。顺便说一句，欢迎进入投票级别；-）