Python 3.x 高噪声图像上的pyteserct
我正在尝试使用pytesseract从一个非常嘈杂的图像中提取文本。我正在处理的图像如下所示: 这就是我得到的结果:Python 3.x 高噪声图像上的pyteserct,python-3.x,python-tesseract,Python 3.x,Python Tesseract,我正在尝试使用pytesseract从一个非常嘈杂的图像中提取文本。我正在处理的图像如下所示: 这就是我得到的结果: df = pytesseract.image_to_data(Image.open("7.png"), output_type='data.frame').dropna()[["text"]] df text 8 ENERGIA 9 538,70 10 € 12 SERVICIOS 13 Y 14 OTROS 1
df = pytesseract.image_to_data(Image.open("7.png"), output_type='data.frame').dropna()[["text"]]
df
text
8 ENERGIA
9 538,70
10 €
12 SERVICIOS
13 Y
14 OTROS
15 CONCEPTOS
16 12,23
17 €
19 IVA
20 21%
21 8/550,93
22 €
23 115,70
24 €
有没有办法改进图像以提取未检测到的文本?我使用的是tesseract v5.0.0-alpha.20200328