Python 如何使用minidom读取XML文件的特殊字符
从XML文件读取数据时,无法获取正确的字符串。Python 如何使用minidom读取XML文件的特殊字符,python,xml,dom,minidom,Python,Xml,Dom,Minidom,从XML文件读取数据时,无法获取正确的字符串。 我的XML文件如下所示: <?xml version="1.0" encoding="ISO-8859-1" ?> <Root> <Name>aa é bb</Name> </Root> 在NameValue中返回u'aa\xc3\xa9 bb' 那么如何在NameValue中获取u'aaébb'或aaébb' 我尝试过编码和解码功能,但没有成功 我想用Python 2.7实现这一
我的XML文件如下所示:
<?xml version="1.0" encoding="ISO-8859-1" ?>
<Root>
<Name>aa é bb</Name>
</Root>
在NameValue
中返回u'aa\xc3\xa9 bb'
那么如何在NameValue
中获取u'aaébb'
或aaébb'
我尝试过编码和解码功能,但没有成功
我想用Python 2.7实现这一点。好的,我有了。我设法做到了这一点:
NameValue = unicode(Item.getElementsByTagName("Name")[0].childNodes[0].data.encode("latin-1"), "utf-8")
感谢您的帮助fanlixu已经获得了正确的unicode值。你是说输出编码吗?尝试打印u'aa\xc3\xa9 bb'.encode(“latin1”),我想将NameValue与另一个包含u'aaébb'的变量进行比较
NameValue = unicode(Item.getElementsByTagName("Name")[0].childNodes[0].data.encode("latin-1"), "utf-8")