Python 解析XML数据_Python_Xml_Parsing_Python 2.7_Xml Parsing

Python 解析XML数据

python xml parsing python-2.7

Python 解析XML数据,python,xml,parsing,python-2.7,xml-parsing,Python,Xml,Parsing,Python 2.7,Xml Parsing,我正在分析这个非常简单的xml文件： <root> <shelter> <adress>21 אחד העם</adress> <code>א-1</code> <lon></lon> <lat></lat> </shelter> <shelter>

我正在分析这个非常简单的xml文件：

<root>
    <shelter>
        <adress>21 אחד העם</adress>
        <code>א-1</code>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>13 שלח</adress>
        <code>10 - א</code>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>ביאליק</adress>
        <code>11 - א</code>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>9 מוריה</adress>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>58 בזל</adress>
        <lon></lon>
        <lat></lat>
    </shelter>
</root>

我使用的是一段简单的代码：

import xml.etree.ElementTree as et
pars = et.XMLParser(encoding='Windows-1255')
tree = et.parse('NewFile.xml',parser=pars)
root = tree.getroot()
for shelter in root.findall('shelter'):
    adress = shelter.find('adress').text
    print adress

我得到这个错误：UnicodeEncodeError:“charmap”编解码器无法对位置3-5中的字符进行编码：字符映射到未定义

正如你可能知道的，文本是用希伯来语写的，我猜这就是我的错误的来源——或者不理解“编码”的意思。我查阅了关于解析和编码问题的不同讨论，但没有一个讨论过外语处理问题

问候。

在尝试运行代码时，我没有收到任何错误。

问题可能在于文件的编码。确保它是utf-8。也可以使用encoding=utf-8。

使用encoding='utf-8'解决问题吗？我试过了。这不是一个工作相同的错误。您必须发现保存文件的编码。基本上，要从unicode转换为字节，需要对字符进行编码。这意味着您要选择一种特定的编码，将某些字符映射到某些字节序列。另一方面，要从字节转换为unicode，需要对字节进行解码。这意味着使用知道如何将字节转换为有意义的字符的编码。但是如果你不知道保存文件的编码，那你就倒霉了，只能猜测了。我认为你的错误意味着编码不知道如何映射某些字符。谢谢，我会继续找的。所以我已经找到了问题所在——我当时正在使用eclipse编辑和运行我的文件，而eclipse控制台不支持希伯来语。