Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/sorting/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 2.7 使用pytesseract创建变量_Python 2.7_Variables_Ocr_Tesseract - Fatal编程技术网

Python 2.7 使用pytesseract创建变量

Python 2.7 使用pytesseract创建变量,python-2.7,variables,ocr,tesseract,Python 2.7,Variables,Ocr,Tesseract,在我的代码中 from PIL import Image import pytesseract print(pytesseract.image_to_string(Image.open('test.png'))) 我从(仅从问题和答案)中得到的结果是: 有没有办法说第1行、第2行和第3行是问题,第5行是答案1,等等?取决于图像之间的数据差异,这应该是可行的。如果你总是有“?”来分开 image_text=pytesseract.image_to_string(Image.open('test

在我的代码中

from PIL import Image
import pytesseract

print(pytesseract.image_to_string(Image.open('test.png')))
我从(仅从问题和答案)中得到的结果是:


有没有办法说第1行、第2行和第3行是问题,第5行是答案1,等等?

取决于图像之间的数据差异,这应该是可行的。如果你总是有“?”来分开

image_text=pytesseract.image_to_string(Image.open('test.png'))
text_list=image_text.split('?')
这将为您提供一个包含2个元素的列表。首先是所有的前?第二次之后。例如:

print(text_list)
['Which team surrendered\nthe biggest lead in Super\nBowl history',
'\n\nAtlanta Falcons\n\nDenver Broncos\n\nBuffalo Bills']
从这里你可以定义q和a。作为问题和答案

q =  text_list[0]
a =  [a for a in text_list[1].split('\n') if a]
上述逻辑将保留问题的新行,并将其格式化为:

Which team surrendered
the biggest lead in Super
Bowl history?
然后变量
a
将填充一个答案列表,列表中没有任何空行。因此,
print(a)
将返回:

['Atlanta Falcons', 'Denver Broncos', 'Buffalo Bills']

请记住,此修复取决于文本中有一个
来定义字符串的哪一半是问题,哪一半是答案

你能列出你的代码当前打印的结果吗?好吧,这个代码应该可以处理任何图片(因此任何输出),但是如果我使用来自的图片,它会像:JK Rowling,然后是Harry Potter,等等。请添加打印的确切结果。您应该能够将其添加到问题的代码中。我想看看,这样我就能帮你分线了。很可能它不会包含要拆分的换行符,但我们可能会很幸运。添加了一个答案。如果这对你有帮助,请告诉我。如果是这样,请随意投票并接受答案。
['Atlanta Falcons', 'Denver Broncos', 'Buffalo Bills']