通过组合基本url,在python中使用scrapy从图像中获取文本?

通过组合基本url,在python中使用scrapy从图像中获取文本?,python,scrapy,Python,Scrapy,我尝试了以下代码: src1 = "https://hms.harvard.edu/"<br/> src = response.css('div.person-line > div > img::attr("src")').extract_first()<br/> src = sites/default/files/hms-faculty-emails/BX0UVXkP.jpg <br/> import urlparse <br

我尝试了以下代码:

src1 = "https://hms.harvard.edu/"<br/>
src = response.css('div.person-line > div > 
      img::attr("src")').extract_first()<br/>
src = sites/default/files/hms-faculty-emails/BX0UVXkP.jpg <br/>
import urlparse <br/>
urlparse.urljoin(src1, src)<br/>
https://hms.harvard.edu/sites/default/files/hms-faculty-emails/BX0UVXkP.jpg<br/>
src2 = urlparse.urljoin(src1,src)<br/>
email = pytesseract.image_to_string(Image.open(src2))<br/>
如何从文本图像中提取电子邮件文本..有人能帮忙吗?

您应该使用io.BufferIO buffer,因为您使用http路径调用函数image\u to\u string。您需要编写如下代码:

def get_text(src):
    response = urlopen(src)
    buffer = io.BytesIO(response.read())
    return pytesseract.image_to_string(Image.open(buffer))

@marni…要在src中获取文本…请执行下一个代码?…我正在运行此命令..printsrc..获取图像url…而不是图像中的文本..@rajeshbojja在src中获取文本是什么意思?@marni…我将我的代码放在这里:src1=我想要文本图像中的链接中的电子邮件文本它是不同的question@marni..can我们收到文本…如果是…请通过密码告诉我..怎么去?
def get_text(src):
    response = urlopen(src)
    buffer = io.BytesIO(response.read())
    return pytesseract.image_to_string(Image.open(buffer))