Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/297.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何从python中的图像(或pdf文件)中提取名称和手写数字?_Python_Opencv_Tensorflow_Ocr_Python Tesseract - Fatal编程技术网

如何从python中的图像(或pdf文件)中提取名称和手写数字?

如何从python中的图像(或pdf文件)中提取名称和手写数字?,python,opencv,tensorflow,ocr,python-tesseract,Python,Opencv,Tensorflow,Ocr,Python Tesseract,我想建立一个项目,当我放入一个pdf文件时,它从中提取打印名称和手写数字,然后将它们放入CSV文件(excel文件) 请注意,pdf文件有一个表,其中一列中有名称,另一列中有手写标记 因此,您能推荐一个示例或最好的python框架或引擎吗 请确保在下图中看到示例 提前感谢您Python框架“Tesseract”可以满足您的需求。你可能想看看这个博客。这里有一些基本的说明 对于手写体,您必须训练模型来检测手写数字,对于扫描文档部分,您可以使用tessaract。我建议您使用Keras。您是否尝试

我想建立一个项目,当我放入一个pdf文件时,它从中提取打印名称手写数字,然后将它们放入CSV文件(excel文件)
请注意,pdf文件有一个,其中一列中有名称,另一列中有手写标记
因此,您能推荐一个示例或最好的python框架或引擎吗 请确保在下图中看到示例


提前感谢您

Python框架“Tesseract”可以满足您的需求。你可能想看看这个博客。这里有一些基本的说明

对于手写体,您必须训练模型来检测手写数字,对于扫描文档部分,您可以使用tessaract。我建议您使用Keras。您是否尝试过谷歌图像API?如果您可以使用非本地代码…问题是:tessract或Pytesract只能检测用特定语言编写的文本,如英语或法语中的完整段落。。。不是名字!名字是另一种类型,我需要知道如何检测names@Adem你也可以用另一种方式建立和训练你自己的CNN。我建议将Keras与Tensorflow结合使用。对于数字,您可以使用MNIST培训的网络。字母检测也有类似的解决方案。你可能需要仔细阅读topic@AdemYoussef OpenCV提供了有用的功能来发现和检测边缘和东西……也许对你有帮助。@sxeros感谢你的帮助,这有点让我觉得正确way@Adem你很乐意帮忙