如何使用ElementTree以Python的方式将标记的值与标记的标签相关联
我有一些xml文件要处理 下面是从其中一个文件派生的示例如何使用ElementTree以Python的方式将标记的值与标记的标签相关联,python,xml-parsing,elementtree,Python,Xml Parsing,Elementtree,我有一些xml文件要处理 下面是从其中一个文件派生的示例 fileAsString = """ <?xml version="1.0" encoding="utf-8"?> <eventDocument> <schemaVersion>X2</schemaVersion> <eventTable> <eventTransaction> <eventTitle>
fileAsString = """
<?xml version="1.0" encoding="utf-8"?>
<eventDocument>
<schemaVersion>X2</schemaVersion>
<eventTable>
<eventTransaction>
<eventTitle>
<value>Some Event</value>
</eventTitle>
<eventDate>
<value>2003-12-31</value>
</eventDate>
<eventCoding>
<eventType>47</eventType>
<eventCode>A</eventCode>
<footnoteId id="F1"/>
<footnoteId id="F2"/>
</eventCoding>
<eventCycled>
<value></value>
</eventCycled>
<eventAmounts>
<eventVoltage>
<value>40000</value>
</eventVoltage>
</eventAmounts>
</eventTransaction>
</eventTable>
</eventDocument>"""
我实际上是从文件中读取这些内容,但假设我有一个字符串,我的代码将获取eventTransaction元素正下方元素的文本,其中文本位于值标记内,如下所示
import xml.etree.cElementTree as ET
myXML = ET.fromstring(fileAsString)
eventTransactions = [ e for e in myXML.iter() if e.tag == 'eventTransaction']
testTransaction = eventTransactions[0]
my_dict = {}
for child_of in testTransaction:
grand_children_tags = [e.tag for e in child_of]
if grand_children_tags == ['value']:
my_dict[child_of.tag] = [e.text for e in child_of][0]
>>> my_dict
{'eventTitle': 'Some Event', 'eventCycled': None, 'eventDate': '2003-12-31'}
这似乎是错误的,因为我并没有真正利用xml,而是使用暴力,但我似乎还没有找到一个例子
是否有一种更清晰、更具python风格的方法来创建我想要的输出?用于提取您感兴趣的元素
以下代码创建DICT列表(即表/事务/信息):
输出:
[[{'eventCode': 'A',
'eventCoding_FTNT_0': 'F1',
'eventCoding_FTNT_1': 'F2',
'eventCycled': '',
'eventDate': '2003-12-31',
'eventTitle': 'Some Event',
'eventType': '47',
'eventVoltage': '40000'}]]
谢谢你的支持insights@exhumoro最后一个太差劲了——非常感谢你抽出时间。我可以从这个例子中学到很多东西answer@PyNEwbie. NP-很高兴能帮忙!顺便说一句,为了保持一致性,我在整个示例中都使用了xpath语法,但是可以通过仅使用标记名替换
/tagname
来稍微简化。真正需要的xpath的唯一用途是//*[value]
,它递归地搜索包含value
子元素的元素。
tables = []
myXML = ET.fromstring(fileAsString)
for table in myXML.findall('./eventTable'):
transactions = []
tables.append(transactions)
for transaction in table.findall('./eventTransaction'):
info = {}
for element in table.findall('.//*[value]'):
info[element.tag] = element.find('./value').text or ''
coding = transaction.find('./eventCoding')
if coding is not None:
for tag in 'eventType', 'eventCode':
element = coding.find('./%s' % tag)
if element is not None:
info[tag] = element.text or ''
for index, element in enumerate(coding.findall('./footnoteId')):
info['eventCoding_FTNT_%d' % index] = element.get('id', '')
if info:
transactions.append(info)
[[{'eventCode': 'A',
'eventCoding_FTNT_0': 'F1',
'eventCoding_FTNT_1': 'F2',
'eventCycled': '',
'eventDate': '2003-12-31',
'eventTitle': 'Some Event',
'eventType': '47',
'eventVoltage': '40000'}]]