Machine learning 使用python实现tesseract ocr的最佳实践

Machine learning 使用python实现tesseract ocr的最佳实践,machine-learning,computer-vision,ocr,tesseract,python-tesseract,Machine Learning,Computer Vision,Ocr,Tesseract,Python Tesseract,我正在进行一个项目,希望识别信用卡大小文档中的文本。该文档包含姓名、电话号码、地址等详细信息。我正在捕获图像,并使用 text=pytesseract.image\u to\u字符串(image.open(文件名),lang='eng')。有时候我在每个领域都取得了不错的成绩,但大多数时候成绩都很糟糕。我如何解决这个问题?最佳做法是什么。文档阅读器如何使用OCR。可以在文档中处理基于区域的ocr吗?单一方法无法读取所有文本。您必须对多种类型的pdf应用多种方法 如果文本不是水平的,则必须旋转文本

我正在进行一个项目,希望识别信用卡大小文档中的文本。该文档包含姓名、电话号码、地址等详细信息。我正在捕获图像,并使用
text=pytesseract.image\u to\u字符串(image.open(文件名),lang='eng')
。有时候我在每个领域都取得了不错的成绩,但大多数时候成绩都很糟糕。我如何解决这个问题?最佳做法是什么。文档阅读器如何使用OCR。可以在文档中处理基于区域的ocr吗?

单一方法无法读取所有文本。您必须对多种类型的pdf应用多种方法

如果文本不是水平的,则必须旋转文本。如果文本是弯曲的,则必须使用变换(例如,hog变换)


此外,使用包装阅读文本时,文本应清晰、水平。否则,您需要创建规则并进行转换。

单一方法无法读取所有文本。您必须对多种类型的pdf应用多种方法

如果文本不是水平的,则必须旋转文本。如果文本是弯曲的,则必须使用变换(例如,hog变换)


此外,使用包装阅读文本时,文本应清晰、水平。否则,您需要创建规则并进行转换。

预处理图像非常重要。通常,您希望所需的文本为黑色,背景为白色。看看,对图像进行预处理是非常重要的。通常,您希望所需的文本为黑色,背景为白色。看一看,,