Python 2.7 使用pytesseract创建变量
在我的代码中Python 2.7 使用pytesseract创建变量,python-2.7,variables,ocr,tesseract,Python 2.7,Variables,Ocr,Tesseract,在我的代码中 from PIL import Image import pytesseract print(pytesseract.image_to_string(Image.open('test.png'))) 我从(仅从问题和答案)中得到的结果是: 有没有办法说第1行、第2行和第3行是问题,第5行是答案1,等等?取决于图像之间的数据差异,这应该是可行的。如果你总是有“?”来分开 image_text=pytesseract.image_to_string(Image.open('test
from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('test.png')))
我从(仅从问题和答案)中得到的结果是:
有没有办法说第1行、第2行和第3行是问题,第5行是答案1,等等?取决于图像之间的数据差异,这应该是可行的。如果你总是有“?”来分开
image_text=pytesseract.image_to_string(Image.open('test.png'))
text_list=image_text.split('?')
这将为您提供一个包含2个元素的列表。首先是所有的前?第二次之后。例如:
print(text_list)
['Which team surrendered\nthe biggest lead in Super\nBowl history',
'\n\nAtlanta Falcons\n\nDenver Broncos\n\nBuffalo Bills']
从这里你可以定义q和a。作为问题和答案
q = text_list[0]
a = [a for a in text_list[1].split('\n') if a]
上述逻辑将保留问题的新行,并将其格式化为:
Which team surrendered
the biggest lead in Super
Bowl history?
然后变量a
将填充一个答案列表,列表中没有任何空行。因此,print(a)
将返回:
['Atlanta Falcons', 'Denver Broncos', 'Buffalo Bills']
请记住,此修复取决于文本中有一个
?
来定义字符串的哪一半是问题,哪一半是答案 你能列出你的代码当前打印的结果吗?好吧,这个代码应该可以处理任何图片(因此任何输出),但是如果我使用来自的图片,它会像:JK Rowling,然后是Harry Potter,等等。请添加打印的确切结果。您应该能够将其添加到问题的代码中。我想看看,这样我就能帮你分线了。很可能它不会包含要拆分的换行符,但我们可能会很幸运。添加了一个答案。如果这对你有帮助,请告诉我。如果是这样,请随意投票并接受答案。
['Atlanta Falcons', 'Denver Broncos', 'Buffalo Bills']