Python 使用正则表达式匹配项作为文本提取的标记
到目前为止我的代码Python 使用正则表达式匹配项作为文本提取的标记,python,regex,search,extract,Python,Regex,Search,Extract,到目前为止我的代码 # -*- coding: utf-8 -*- import os, sys, re, codecs 第一部分 第二部分 我要搜索的文件 Mittwoch, 15. März 2017 14:30 Uhr 17:30 Uhr Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna al
# -*- coding: utf-8 -*-
import os, sys, re, codecs
第一部分
第二部分
我要搜索的文件
Mittwoch, 15. März 2017
14:30 Uhr
17:30 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
sed diam voluptua.
Donnerstag, 16. März 2017
Samstag, 18. März 2017
Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
sed diam voluptua.
Greifswald, 16 - 18 March 2017
Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
Donnerstag, 16. März 2017
17:30 Uhr
19:00 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
sed diam voluptua.
我的输出
Mittwoch, 15. März 2017
Donnerstag, 16. März 2017
Samstag, 18. März 2017
Donnerstag, 16. März 2017
我想要什么
Mittwoch, 15. März 2017
Donnerstag, 16. März 2017
Samstag, 18. März 2017
Donnerstag, 16. März 2017
正如您所见,代码提取了以特定德语格式编写的日期。第二部分在两个字符串之间搜索。
我需要一种方法将第1部分中找到的日期用作第2部分中的target1和target2。
通过这种方式,我想提取以下部分:
Mittwoch, 15. März 2017
14:30 Uhr
17:30 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
sed diam voluptua.
然后将这些部分写入单个文件。
有人能帮我吗?我不明白,这怎么可能是重复的,也许不是,正如我看到的
元素={}(.+?){}.format(target1,target2)
。所以请帮助我理解,你有什么困难?您是否需要帮助从第1部分中的完整正则表达式中提取日期?您可以使用类似于(Montag | Dienstag | Mittwoch | Donnerstag | Freitag | Samstag | Sonnabend | Sonntag)的表达式
使用dotall查找所需文本块,然后分析所需文本块。注意:此模式将找不到最终文本块。
Mittwoch, 15. März 2017
14:30 Uhr
17:30 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat,
sed diam voluptua.