Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/326.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用正则表达式匹配项作为文本提取的标记_Python_Regex_Search_Extract - Fatal编程技术网

Python 使用正则表达式匹配项作为文本提取的标记

Python 使用正则表达式匹配项作为文本提取的标记,python,regex,search,extract,Python,Regex,Search,Extract,到目前为止我的代码 # -*- coding: utf-8 -*- import os, sys, re, codecs 第一部分 第二部分 我要搜索的文件 Mittwoch, 15. März 2017 14:30 Uhr 17:30 Uhr Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna al

到目前为止我的代码

# -*- coding: utf-8 -*-

import os, sys, re, codecs
第一部分 第二部分 我要搜索的文件

Mittwoch, 15. März 2017
14:30 Uhr
17:30 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, 
sed diam voluptua.
Donnerstag, 16. März 2017
Samstag, 18. März 2017
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, 
sed diam voluptua.
Greifswald, 16 - 18 March 2017
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, 
Donnerstag, 16. März 2017
17:30 Uhr
19:00 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, 
sed diam voluptua.
我的输出

Mittwoch, 15. März 2017

Donnerstag, 16. März 2017

Samstag, 18. März 2017

Donnerstag, 16. März 2017
我想要什么

Mittwoch, 15. März 2017

Donnerstag, 16. März 2017

Samstag, 18. März 2017

Donnerstag, 16. März 2017
正如您所见,代码提取了以特定德语格式编写的日期。第二部分在两个字符串之间搜索。 我需要一种方法将第1部分中找到的日期用作第2部分中的target1和target2。 通过这种方式,我想提取以下部分:

Mittwoch, 15. März 2017
14:30 Uhr
17:30 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, 
sed diam voluptua.
然后将这些部分写入单个文件。
有人能帮我吗?

我不明白,这怎么可能是重复的,也许不是,正如我看到的
元素={}(.+?){}.format(target1,target2)
。所以请帮助我理解,你有什么困难?您是否需要帮助从第1部分中的完整正则表达式中提取日期?您可以使用类似于
(Montag | Dienstag | Mittwoch | Donnerstag | Freitag | Samstag | Sonnabend | Sonntag)的表达式
使用dotall查找所需文本块,然后分析所需文本块。注意:此模式将找不到最终文本块。
Mittwoch, 15. März 2017
14:30 Uhr
17:30 Uhr
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, 
sed diam voluptua.