Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/70.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用urllib2从html提取数据显示错误格式不正确(无效标记):第5行第62列_Html_Python 2.7_Web Scraping - Fatal编程技术网

使用urllib2从html提取数据显示错误格式不正确(无效标记):第5行第62列

使用urllib2从html提取数据显示错误格式不正确(无效标记):第5行第62列,html,python-2.7,web-scraping,Html,Python 2.7,Web Scraping,我有一个从印度卢比到美元的转换代码,我使用谷歌货币转换api来实现这一点 使用的代码: url="https://www.google.com/finance/converter?a=%s&from=%s&to=%s"(total_incl_tax,'INR','USD') file = urllib2.urlopen(url) data = file.read() print "dataaaaaaaaaaaaaaa",data file.close() dom = parse

我有一个从印度卢比到美元的转换代码,我使用谷歌货币转换api来实现这一点

使用的代码:

url="https://www.google.com/finance/converter?a=%s&from=%s&to=%s"(total_incl_tax,'INR','USD')

file = urllib2.urlopen(url)
data = file.read()
print "dataaaaaaaaaaaaaaa",data
file.close()
dom = parseString(data)
xmlTag = dom.getElementsByTagName('span')[0].toxml()
xmlData=xmlTag.replace('<span>','').replace('</span>','')
print "dommmmmmmmmmmmmmmmmmmmmmmmmmmmmm",xmlData

使用此选项时,我收到以下错误:格式不正确无效标记:第5行,第62列。如何从html获取数据,并且数据位于span标记之间。请提供帮助?

您在尝试分析字符串时遇到错误:

dom = parseString(data)
这是因为问题中提到的URL是。然而,对于一个语法分析器,其工作原理与预期相同

专业提示:不要使用urlib2或xml.dom.minidom,而是使用请求和美化组