如何使用ElementTree以Python的方式将标记的值与标记的标签相关联_Python_Xml Parsing_Elementtree

如何使用ElementTree以Python的方式将标记的值与标记的标签相关联

python

如何使用ElementTree以Python的方式将标记的值与标记的标签相关联,python,xml-parsing,elementtree,Python,Xml Parsing,Elementtree,我有一些xml文件要处理下面是从其中一个文件派生的示例 fileAsString = """ <?xml version="1.0" encoding="utf-8"?> <eventDocument> <schemaVersion>X2</schemaVersion> <eventTable> <eventTransaction> <eventTitle>

我有一些xml文件要处理

下面是从其中一个文件派生的示例

fileAsString = """
<?xml version="1.0" encoding="utf-8"?>
<eventDocument>
<schemaVersion>X2</schemaVersion>

  <eventTable>
       <eventTransaction>
           <eventTitle>
               <value>Some Event</value>
           </eventTitle>
           <eventDate>
               <value>2003-12-31</value>
           </eventDate>
           <eventCoding>
               <eventType>47</eventType>
               <eventCode>A</eventCode>
               <footnoteId id="F1"/>
               <footnoteId id="F2"/>
           </eventCoding>
           <eventCycled>
               <value></value>
           </eventCycled>
           <eventAmounts>
                <eventVoltage>
                <value>40000</value>
                </eventVoltage>
           </eventAmounts>
      </eventTransaction>
   </eventTable>
</eventDocument>"""

我实际上是从文件中读取这些内容，但假设我有一个字符串，我的代码将获取eventTransaction元素正下方元素的文本，其中文本位于值标记内，如下所示

import xml.etree.cElementTree as ET
myXML = ET.fromstring(fileAsString)
eventTransactions = [ e for e in myXML.iter() if e.tag == 'eventTransaction']
testTransaction = eventTransactions[0]
my_dict = {}
for child_of in testTransaction:
    grand_children_tags = [e.tag for e in child_of]
    if grand_children_tags == ['value']:
        my_dict[child_of.tag] = [e.text for e in child_of][0]

>>> my_dict
{'eventTitle': 'Some Event', 'eventCycled': None, 'eventDate': '2003-12-31'}

这似乎是错误的，因为我并没有真正利用xml，而是使用暴力，但我似乎还没有找到一个例子

是否有一种更清晰、更具python风格的方法来创建我想要的输出？

用于提取您感兴趣的元素

以下代码创建DICT列表（即表/事务/信息）：

输出：

[[{'eventCode': 'A',
   'eventCoding_FTNT_0': 'F1',
   'eventCoding_FTNT_1': 'F2',
   'eventCycled': '',
   'eventDate': '2003-12-31',
   'eventTitle': 'Some Event',
   'eventType': '47',
   'eventVoltage': '40000'}]]

谢谢你的支持insights@exhumoro最后一个太差劲了——非常感谢你抽出时间。我可以从这个例子中学到很多东西answer@PyNEwbie. NP-很高兴能帮忙！顺便说一句，为了保持一致性，我在整个示例中都使用了xpath语法，但是可以通过仅使用标记名替换

/tagname

来稍微简化。真正需要的xpath的唯一用途是

//*[value]

，它递归地搜索包含

value

子元素的元素。

tables = []
myXML = ET.fromstring(fileAsString)
for table in myXML.findall('./eventTable'):
    transactions = []
    tables.append(transactions)
    for transaction in table.findall('./eventTransaction'):
        info = {}
        for element in table.findall('.//*[value]'):
            info[element.tag] = element.find('./value').text or ''
        coding = transaction.find('./eventCoding')
        if coding is not None:
            for tag in 'eventType', 'eventCode':
                element = coding.find('./%s' % tag)
                if element is not None:
                    info[tag] = element.text or ''
            for index, element in enumerate(coding.findall('./footnoteId')):
                info['eventCoding_FTNT_%d' % index] = element.get('id', '')
        if info:
            transactions.append(info)

[[{'eventCode': 'A',
   'eventCoding_FTNT_0': 'F1',
   'eventCoding_FTNT_1': 'F2',
   'eventCycled': '',
   'eventDate': '2003-12-31',
   'eventTitle': 'Some Event',
   'eventType': '47',
   'eventVoltage': '40000'}]]