Python lxml etree和xpath返回src的编码图像而不是URL

Python lxml etree和xpath返回src的编码图像而不是URL,python,python-2.7,xpath,html-parsing,lxml,Python,Python 2.7,Xpath,Html Parsing,Lxml,当我处理一些html时,我想要一个图像的src url,但我得到的是一个编码图像。如果我想要url,我做错了什么 给定一个url,如:“ 和桌面用户代理: from lxml import etree import requests page = requests.get(url, headers=agent) page_txt = page.text html_parser = etree.HTMLParser() tree = etree.parse(StringIO(page_txt)

当我处理一些html时,我想要一个图像的src url,但我得到的是一个编码图像。如果我想要url,我做错了什么

给定一个url,如:“

和桌面用户代理:

from lxml import etree
import requests

page = requests.get(url, headers=agent)
page_txt = page.text

html_parser = etree.HTMLParser()
tree = etree.parse(StringIO(page_txt), html_parser)

path = '//img[@id="landingImage"]'

img = tree.xpath(path)

img_src = img[0].get('src')
使用该代码,我将返回:

'\n数据:图像/jpeg;base64,/9j/4AAQSkZJR'(截断)

当我想要的时候:

src
属性中有一个。您可以从
data-a-dynamic-image
属性获取实际URL,它包含包含URL的JSON字符串:

import json 

path = '//img[@id="landingImage"]/@data-a-dynamic-image'
print next(json.loads(tree.xpath(path)[0]).iterkeys())
印刷品:

http://ecx.images-amazon.com/images/I/41SNmVfXvhL._SX466_.jpg

谢谢你!我感谢你的帮助。