使用urllib2从html提取数据显示错误格式不正确(无效标记):第5行第62列
我有一个从印度卢比到美元的转换代码,我使用谷歌货币转换api来实现这一点 使用的代码:使用urllib2从html提取数据显示错误格式不正确(无效标记):第5行第62列,html,python-2.7,web-scraping,Html,Python 2.7,Web Scraping,我有一个从印度卢比到美元的转换代码,我使用谷歌货币转换api来实现这一点 使用的代码: url="https://www.google.com/finance/converter?a=%s&from=%s&to=%s"(total_incl_tax,'INR','USD') file = urllib2.urlopen(url) data = file.read() print "dataaaaaaaaaaaaaaa",data file.close() dom = parse
url="https://www.google.com/finance/converter?a=%s&from=%s&to=%s"(total_incl_tax,'INR','USD')
file = urllib2.urlopen(url)
data = file.read()
print "dataaaaaaaaaaaaaaa",data
file.close()
dom = parseString(data)
xmlTag = dom.getElementsByTagName('span')[0].toxml()
xmlData=xmlTag.replace('<span>','').replace('</span>','')
print "dommmmmmmmmmmmmmmmmmmmmmmmmmmmmm",xmlData
使用此选项时,我收到以下错误:格式不正确无效标记:第5行,第62列。如何从html获取数据,并且数据位于span标记之间。请提供帮助?您在尝试分析字符串时遇到错误:
dom = parseString(data)
这是因为问题中提到的URL是。然而,对于一个语法分析器,其工作原理与预期相同
专业提示:不要使用urlib2或xml.dom.minidom,而是使用请求和美化组