Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/20.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 正则表达式,删除不在标记之间的文本_Regex_Excel_Notepad++ - Fatal编程技术网

Regex 正则表达式,删除不在标记之间的文本

Regex 正则表达式,删除不在标记之间的文本,regex,excel,notepad++,Regex,Excel,Notepad++,我需要删除所有不在标记和之间的文本。每个单元格中可能有许多标记。每行中之前和之后的内容不同 范例 <h1>Curly Krans Daggdroppar 30cm LED</h1><h2>Beskrivning</h2><div id="more_info_sheets" class="sheets align_justify"><div id="idTab1" class="rte"><div id="more_in

我需要删除所有不在标记

之间的文本。每个单元格中可能有许多
标记。每行中
之前和
之后的内容不同

范例

<h1>Curly Krans Daggdroppar 30cm LED</h1><h2>Beskrivning</h2><div id="more_info_sheets" class="sheets align_justify"><div id="idTab1" class="rte"><div id="more_info_sheets" class="sheets align_justify"><div id="idTab1" class="rte"><p>En krans med en snygg och intressant design. </p><p>Kransen har 30st ej utbytbara små LED lampor.</p><p>Finns i tre olika färger, välj mellan, koppar, mässing och krom.</p></div></div></div></div>
卷曲的Krans Daggdroppar 30厘米长的Ledbeskrining采用Krans med En snygg och快速设计。

Kransen har 30st ej utbytbara småLED灯。

芬兰人i tre olika färger、välj mellan、koppar、mässing och krom

应该是

<p>En krans med en snygg och intressant design. </p><p>Kransen har 30st ej utbytbara små LED lampor.</p><p>Finns i tre olika färger, välj mellan, koppar, mässing och krom.</p>
在krans med En snygg och Inpressant design.

Kransen har 30街utbytbara småLED lampor.

Finns i tre olika färger,välj mellan,koppar,mässing och krom


有人知道怎么做吗?

您可以使用匹配表达式仅捕获所需的标记组,而不是替换文本的其余部分。但是,这里是常规表达式的另一个选项:

匹配所有p组

<p>.*<\/p>
(^.*?(?=<p>))|((?<=<\/p>)<[^p].*)
*
分别匹配每个p组

<p>.*?<\/p>
*?
匹配非p组

<p>.*<\/p>
(^.*?(?=<p>))|((?<=<\/p>)<[^p].*)

(^.*(?=))|((?你想实现什么?你的环境是什么?你想如何删除这个?我想删除所有H1和H2文本以及所有div标记。需要在记事本++或Excel中从.csv文件中完成。我的目标是只获得带有p标记的干净文本。我可以先用^.*(?=)删除所有内容但是如何在last

之后删除所有内容呢?因此,stape regex响应不是在标记上使用regex,而是有更好的工具,比如xPath。