Python 从urlopen检索的XML数据替换了<&引用;及&燃气轮机&引用;加上&引用;

Python 从urlopen检索的XML数据替换了<&引用;及&燃气轮机&引用;加上&引用;,python,xml,Python,Xml,我正在从url检索数据,如下所示: data=urllib2.urlopen(url.read() 但是,我注意到没有标签。这是因为“”被替换为“;”字符。其他一切都完好无损。 因此: 条更改为;傅;酒吧/傅 我如何解决这个问题?为什么会发生 [编辑]:我找到了修复它的方法。显然,它是在用'>'替换''。我猜符号的简短形式。我仍然不知道为什么会这样。我猜webservice/API中有一些bug。我刚刚运行了以下命令: import urllib2 url='http://

我正在从url检索数据,如下所示:

data=urllib2.urlopen(url.read()

但是,我注意到没有标签。这是因为“”被替换为“;”字符。其他一切都完好无损。 因此:

更改为
;傅;酒吧/傅

我如何解决这个问题?为什么会发生

[编辑]:我找到了修复它的方法。显然,它是在用'>'替换''。我猜符号的简短形式。我仍然不知道为什么会这样。我猜webservice/API中有一些bug。

我刚刚运行了以下命令:

    import urllib2

    url='http://www.google.com'
    data = urllib2.urlopen(url).read()
    print data
我得到了大量的,包括最后一行


您能否发布更多详细信息,如您试图访问的url和
数据的值

XML的来源是什么?这绝不是由
urllib2
引起的。你100%确定服务器没有生成这些数据吗?当我在IE或FF中打开url时,我可以很好地看到标记。链接和数据都是机密的,因为它们存在于我的工作中。不过,我会删除敏感信息并发布数据。你有没有尝试过上面的方法并抓取谷歌的主页?我在家试过,效果很好。但只能在明天的工作中尝试。