Regex 正则表达式,删除不在标记之间的文本
我需要删除所有不在标记Regex 正则表达式,删除不在标记之间的文本,regex,excel,notepad++,Regex,Excel,Notepad++,我需要删除所有不在标记和之间的文本。每个单元格中可能有许多标记。每行中之前和之后的内容不同 范例 <h1>Curly Krans Daggdroppar 30cm LED</h1><h2>Beskrivning</h2><div id="more_info_sheets" class="sheets align_justify"><div id="idTab1" class="rte"><div id="more_in
和
之间的文本。每个单元格中可能有许多
标记。每行中
之前和
之后的内容不同
范例
<h1>Curly Krans Daggdroppar 30cm LED</h1><h2>Beskrivning</h2><div id="more_info_sheets" class="sheets align_justify"><div id="idTab1" class="rte"><div id="more_info_sheets" class="sheets align_justify"><div id="idTab1" class="rte"><p>En krans med en snygg och intressant design. </p><p>Kransen har 30st ej utbytbara små LED lampor.</p><p>Finns i tre olika färger, välj mellan, koppar, mässing och krom.</p></div></div></div></div>
卷曲的Krans Daggdroppar 30厘米长的Ledbeskrining采用Krans med En snygg och快速设计。Kransen har 30st ej utbytbara småLED灯。芬兰人i tre olika färger、välj mellan、koppar、mässing och krom
应该是
<p>En krans med en snygg och intressant design. </p><p>Kransen har 30st ej utbytbara små LED lampor.</p><p>Finns i tre olika färger, välj mellan, koppar, mässing och krom.</p>
在krans med En snygg och Inpressant design.Kransen har 30街utbytbara småLED lampor.Finns i tre olika färger,välj mellan,koppar,mässing och krom
有人知道怎么做吗?您可以使用匹配表达式仅捕获所需的标记组,而不是替换文本的其余部分。但是,这里是常规表达式的另一个选项: 匹配所有p组
<p>.*<\/p>
(^.*?(?=<p>))|((?<=<\/p>)<[^p].*)
*
分别匹配每个p组
<p>.*?<\/p>
*?
匹配非p组
<p>.*<\/p>
(^.*?(?=<p>))|((?<=<\/p>)<[^p].*)
(^.*(?=))|((?你想实现什么?你的环境是什么?你想如何删除这个?我想删除所有H1和H2文本以及所有div标记。需要在记事本++或Excel中从.csv文件中完成。我的目标是只获得带有p标记的干净文本。我可以先用^.*(?=)删除所有内容但是如何在last之后删除所有内容呢?因此,stape regex响应不是在标记上使用regex,而是有更好的工具,比如xPath。