Python 从urlopen检索的XML数据替换了<&引用；及&燃气轮机&引用；加上&引用；_Python_Xml

Python 从urlopen检索的XML数据替换了<&引用；及&燃气轮机&引用；加上&引用；

python xml

Python 从urlopen检索的XML数据替换了<&引用；及&燃气轮机&引用；加上&引用；,python,xml,Python,Xml,我正在从url检索数据，如下所示： data=urllib2.urlopen（url.read（）但是，我注意到没有标签。这是因为“”被替换为“；”字符。其他一切都完好无损。因此：条更改为；傅；酒吧/傅我如何解决这个问题？为什么会发生 [编辑]：我找到了修复它的方法。显然，它是在用'>'替换''。我猜符号的简短形式。我仍然不知道为什么会这样。我猜webservice/API中有一些bug。我刚刚运行了以下命令： import urllib2 url='http://

我正在从url检索数据，如下所示：

data=urllib2.urlopen（url.read（）

但是，我注意到没有标签。这是因为“”被替换为“；”字符。其他一切都完好无损。因此：

条

更改为

；傅；酒吧/傅
我如何解决这个问题？为什么会发生
[编辑]：我找到了修复它的方法。显然，它是在用'>'替换''。我猜符号的简短形式。我仍然不知道为什么会这样。我猜webservice/API中有一些bug。
我刚刚运行了以下命令：
    import urllib2

    url='http://www.google.com'
    data = urllib2.urlopen(url).read()
    print data

我得到了大量的，包括最后一行

您能否发布更多详细信息，如您试图访问的url和数据的值
 XML的来源是什么？这绝不是由urllib2
引起的。你100%确定服务器没有生成这些数据吗？当我在IE或FF中打开url时，我可以很好地看到标记。链接和数据都是机密的，因为它们存在于我的工作中。不过，我会删除敏感信息并发布数据。你有没有尝试过上面的方法并抓取谷歌的主页？我在家试过，效果很好。但只能在明天的工作中尝试。