从XML文件提取日期和时间:Python

从XML文件提取日期和时间:Python,python,Python,下面的代码是用python编写的 import os import lxml.etree as ET import re os.chdir(r'C:\Users\Wadi\Desktop') tree = ET.parse('XMLData.xml') pathology_case_retrieval_report = tree.getroot() 根元素(病理学\病例\检索\报告)的第0个子元素是报告\信息标记。此标记不包含任何特定案例的信息。个别案例从根元素的索引1处的案例开始

下面的代码是用python编写的

import os

import lxml.etree as ET

import re

os.chdir(r'C:\Users\Wadi\Desktop')

tree = ET.parse('XMLData.xml')

pathology_case_retrieval_report = tree.getroot()
根元素(病理学\病例\检索\报告)的第0个子元素是报告\信息标记。此标记不包含任何特定案例的信息。个别案例从根元素的索引1处的案例开始

for case in pathology_case_retrieval_report[1:]:
所有案例都有3个子标签:caseAccesion、caseDetails和caseReport

    for caseAccesion_caseDetails_caseReport in case:
        for reportSection in caseAccesion_caseDetails_caseReport:
            for title_text in reportSection:
                if title_text.tag == 'TITLE':
                    if title_text.text == 'Gross Description':
                        x = 'Gross Description'+ ':' +title_text.getnext().text
                        print(x)
我们只在报告部分内寻找标题标签。在报告部分内的标题标签中,我们只关心中间有“粗略描述”的标签。在“报告”部分内的标题标签中,中间有“总体描述”,我们只对其直接(和唯一兄弟)的文本信息感兴趣

以下是输出的示例:

Gross Description: TEXT TEXT TEXT TEXT TEXT.

Specimen collected: d-d-dd/dd:dd. Specimen placed in formalin: dd:dd.

Gross Description: TEXT TEXT TEXT TEXT TEXT Specimen collected: dd:dd. Specimen placed in formalin: dd:dd.

Gross Description: TEXT TEXT TEXT TEXT TEXT.

Specimen collected: d-d-dd/dddd. Specimen placed in formalin: dddd/d-d-dd.

TEXT TEXT TEXT TEXT TEXT

Specimen collected: d-d-dd/dddd. Specimen placed in formalin: dddd/d-d-dd.
我已经编写了正则表达式来捕获字符串“收集的样本:d-d-dd/dddddd”。福尔马林中放置的样本:dddd/d-d-dd'。但是,我最终只需要捕获日期和时间(转换为整数)。我该怎么做呢

此外,当我“打印(x)”时,我希望数据显示如下:

1) Gross Description: The specimen,...
Specimen collected: dd:dd. Specimen placed in formalin: dd:dd.
2) Gross Description: Specimen A, ...
Specimen collected: d-d-dd/dddd. Specimen placed in formalin: dddd/d-d-dd.
Specimen B, ...
Specimen collected: d-d-dd/dddd. Specimen placed in formalin: dddd/d-d-dd.
基本上,我希望每个粗略的描述都要编号,这样我就可以跟踪它。我该如何给它们编号


提前感谢您

将结果数据收集到元组列表中,将计数器变量添加到循环中,并且在向元组添加数据时,也将计数器值添加到元组列表中。然后,在打印结果(列表)时,打印出每个元素,可以是: -计数器值(订单号); -大体描述;
-样本信息等。

谢谢。我一直在想办法在列表中收集我的结果?有什么想法吗?我想出来了。感谢GrossDescriptionsList=[]病理学中的病例检索报告[1:]:病例报告中的病例详情报告:病例报告中的报告部分病例详情报告:病例报告中的标题文本部分:if(title\u text.tag='title'和title\u text.text='Gross Description'):grossDescriptions='grossdescription'+':'+title_text.getnext().text grossDescriptionslist.append(grossDescriptions)