Python 解析XML数据

Python 解析XML数据,python,xml,parsing,python-2.7,xml-parsing,Python,Xml,Parsing,Python 2.7,Xml Parsing,我正在分析这个非常简单的xml文件: <root> <shelter> <adress>21 אחד העם</adress> <code>א-1</code> <lon></lon> <lat></lat> </shelter> <shelter>

我正在分析这个非常简单的xml文件:

<root>
    <shelter>
        <adress>21 אחד העם</adress>
        <code>א-1</code>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>13 שלח</adress>
        <code>10 - א</code>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>ביאליק</adress>
        <code>11 - א</code>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>9 מוריה</adress>
        <lon></lon>
        <lat></lat>
    </shelter>
    <shelter>
        <adress>58 בזל</adress>
        <lon></lon>
        <lat></lat>
    </shelter>
</root>
我使用的是一段简单的代码:

import xml.etree.ElementTree as et
pars = et.XMLParser(encoding='Windows-1255')
tree = et.parse('NewFile.xml',parser=pars)
root = tree.getroot()
for shelter in root.findall('shelter'):
    adress = shelter.find('adress').text
    print adress
我得到这个错误:UnicodeEncodeError:“charmap”编解码器无法对位置3-5中的字符进行编码:字符映射到未定义

正如你可能知道的,文本是用希伯来语写的,我猜这就是我的错误的来源——或者不理解“编码”的意思。 我查阅了关于解析和编码问题的不同讨论,但没有一个讨论过外语处理问题


问候。

在尝试运行代码时,我没有收到任何错误。
问题可能在于文件的编码。确保它是utf-8。也可以使用encoding=utf-8。

使用encoding='utf-8'解决问题吗?我试过了。这不是一个工作相同的错误。您必须发现保存文件的编码。基本上,要从unicode转换为字节,需要对字符进行编码。这意味着您要选择一种特定的编码,将某些字符映射到某些字节序列。另一方面,要从字节转换为unicode,需要对字节进行解码。这意味着使用知道如何将字节转换为有意义的字符的编码。但是如果你不知道保存文件的编码,那你就倒霉了,只能猜测了。我认为你的错误意味着编码不知道如何映射某些字符。谢谢,我会继续找的。所以我已经找到了问题所在——我当时正在使用eclipse编辑和运行我的文件,而eclipse控制台不支持希伯来语。