Python 3.x 在Python中,如何根据条件构造遍历列表的结构?

Python 3.x 在Python中,如何根据条件构造遍历列表的结构?,python-3.x,regex,Python 3.x,Regex,我正在阅读PDF并将元素保存到列表中。我需要使用正则表达式获取名称和日期。我对正则表达式很在行,但不知道如何将其逻辑化 当我遍历一个列表(每个元素都是PDF中的一行)时,我有如下内容: 部分名称 说出一个 日期 名字b 日期 名称c 日期 名称d 日期 下一节名称 我认为字体大小是一种误导,因为您已经有了一种检测节头行的方法。由于这些行不包含数据,您只需忽略它们并让循环在其余行上运行即可保存数据: 对于页面中的行: 如果不匹配(“^Some Section Name”,第行,re.IGNOREC

我正在阅读PDF并将元素保存到列表中。我需要使用正则表达式获取名称和日期。我对正则表达式很在行,但不知道如何将其逻辑化

当我遍历一个列表(每个元素都是PDF中的一行)时,我有如下内容:

部分名称 说出一个 日期 名字b 日期 名称c 日期 名称d 日期 下一节名称
我认为字体大小是一种误导,因为您已经有了一种检测节头行的方法。由于这些行不包含数据,您只需忽略它们并让循环在其余行上运行即可保存数据:

对于页面中的行:
如果不匹配(“^Some Section Name”,第行,re.IGNORECASE):
#从此行保存名称和日期

您可以执行以下操作

for line in page:
if re.match("^Some Section Name", line, re.IGNORECASE):
    while(names and dates):
        if fontsize != 9t:
            break;

        save names and dates until the Next Section