Python 2.7 使用pytesseract创建变量_Python 2.7_Variables_Ocr_Tesseract

Python 2.7 使用pytesseract创建变量

python-2.7 variables

Python 2.7 使用pytesseract创建变量,python-2.7,variables,ocr,tesseract,Python 2.7,Variables,Ocr,Tesseract,在我的代码中 from PIL import Image import pytesseract print(pytesseract.image_to_string(Image.open('test.png'))) 我从（仅从问题和答案）中得到的结果是：有没有办法说第1行、第2行和第3行是问题，第5行是答案1，等等？取决于图像之间的数据差异，这应该是可行的。如果你总是有“？”来分开 image_text=pytesseract.image_to_string(Image.open('test

在我的代码中

from PIL import Image
import pytesseract

print(pytesseract.image_to_string(Image.open('test.png')))

我从（仅从问题和答案）中得到的结果是：

有没有办法说第1行、第2行和第3行是问题，第5行是答案1，等等？

取决于图像之间的数据差异，这应该是可行的。如果你总是有“？”来分开

image_text=pytesseract.image_to_string(Image.open('test.png'))
text_list=image_text.split('?')

这将为您提供一个包含2个元素的列表。首先是所有的前？第二次之后。例如：

print(text_list)
['Which team surrendered\nthe biggest lead in Super\nBowl history',
'\n\nAtlanta Falcons\n\nDenver Broncos\n\nBuffalo Bills']

从这里你可以定义q和a。作为问题和答案

q =  text_list[0]
a =  [a for a in text_list[1].split('\n') if a]

上述逻辑将保留问题的新行，并将其格式化为：

Which team surrendered
the biggest lead in Super
Bowl history?

然后变量

将填充一个答案列表，列表中没有任何空行。因此，

print（a）

将返回：

['Atlanta Falcons', 'Denver Broncos', 'Buffalo Bills']

请记住，此修复取决于文本中有一个

？

来定义字符串的哪一半是问题，哪一半是答案

你能列出你的代码当前打印的结果吗？好吧，这个代码应该可以处理任何图片（因此任何输出），但是如果我使用来自的图片，它会像：JK Rowling，然后是Harry Potter，等等。请添加打印的确切结果。您应该能够将其添加到问题的代码中。我想看看，这样我就能帮你分线了。很可能它不会包含要拆分的换行符，但我们可能会很幸运。添加了一个答案。如果这对你有帮助，请告诉我。如果是这样，请随意投票并接受答案。

['Atlanta Falcons', 'Denver Broncos', 'Buffalo Bills']