使用urllib2从html提取数据显示错误格式不正确（无效标记）：第5行第62列_Html_Python 2.7_Web Scraping

使用urllib2从html提取数据显示错误格式不正确（无效标记）：第5行第62列

html python-2.7 web-scraping

使用urllib2从html提取数据显示错误格式不正确（无效标记）：第5行第62列,html,python-2.7,web-scraping,Html,Python 2.7,Web Scraping,我有一个从印度卢比到美元的转换代码，我使用谷歌货币转换api来实现这一点使用的代码： url="https://www.google.com/finance/converter?a=%s&from=%s&to=%s"(total_incl_tax,'INR','USD') file = urllib2.urlopen(url) data = file.read() print "dataaaaaaaaaaaaaaa",data file.close() dom = parse

我有一个从印度卢比到美元的转换代码，我使用谷歌货币转换api来实现这一点

使用的代码：

url="https://www.google.com/finance/converter?a=%s&from=%s&to=%s"(total_incl_tax,'INR','USD')

file = urllib2.urlopen(url)
data = file.read()
print "dataaaaaaaaaaaaaaa",data
file.close()
dom = parseString(data)
xmlTag = dom.getElementsByTagName('span')[0].toxml()
xmlData=xmlTag.replace('<span>','').replace('</span>','')
print "dommmmmmmmmmmmmmmmmmmmmmmmmmmmmm",xmlData

使用此选项时，我收到以下错误：格式不正确无效标记：第5行，第62列。如何从html获取数据，并且数据位于span标记之间。请提供帮助？

您在尝试分析字符串时遇到错误：

dom = parseString(data)

这是因为问题中提到的URL是。然而，对于一个语法分析器，其工作原理与预期相同

专业提示：不要使用urlib2或xml.dom.minidom，而是使用请求和美化组