Machine learning 使用python实现tesseract ocr的最佳实践_Machine Learning_Computer Vision_Ocr_Tesseract_Python Tesseract

Machine learning 使用python实现tesseract ocr的最佳实践

machine-learning computer-vision

Machine learning 使用python实现tesseract ocr的最佳实践,machine-learning,computer-vision,ocr,tesseract,python-tesseract,Machine Learning,Computer Vision,Ocr,Tesseract,Python Tesseract,我正在进行一个项目，希望识别信用卡大小文档中的文本。该文档包含姓名、电话号码、地址等详细信息。我正在捕获图像，并使用 text=pytesseract.image\u to\u字符串（image.open（文件名），lang='eng'）。有时候我在每个领域都取得了不错的成绩，但大多数时候成绩都很糟糕。我如何解决这个问题？最佳做法是什么。文档阅读器如何使用OCR。可以在文档中处理基于区域的ocr吗？单一方法无法读取所有文本。您必须对多种类型的pdf应用多种方法如果文本不是水平的，则必须旋转文本

我正在进行一个项目，希望识别信用卡大小文档中的文本。该文档包含姓名、电话号码、地址等详细信息。我正在捕获图像，并使用

text=pytesseract.image\u to\u字符串（image.open（文件名），lang='eng'）

。有时候我在每个领域都取得了不错的成绩，但大多数时候成绩都很糟糕。我如何解决这个问题？最佳做法是什么。文档阅读器如何使用OCR。可以在文档中处理基于区域的ocr吗？

单一方法无法读取所有文本。您必须对多种类型的pdf应用多种方法

如果文本不是水平的，则必须旋转文本。如果文本是弯曲的，则必须使用变换（例如，hog变换）

此外，使用包装阅读文本时，文本应清晰、水平。否则，您需要创建规则并进行转换。

单一方法无法读取所有文本。您必须对多种类型的pdf应用多种方法

如果文本不是水平的，则必须旋转文本。如果文本是弯曲的，则必须使用变换（例如，hog变换）

此外，使用包装阅读文本时，文本应清晰、水平。否则，您需要创建规则并进行转换。

预处理图像非常重要。通常，您希望所需的文本为黑色，背景为白色。看看，对图像进行预处理是非常重要的。通常，您希望所需的文本为黑色，背景为白色。看一看,，