Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 正则表达式选择整个字符串,但忽略子字符串匹配_Regex_Regex Negation - Fatal编程技术网

Regex 正则表达式选择整个字符串,但忽略子字符串匹配

Regex 正则表达式选择整个字符串,但忽略子字符串匹配,regex,regex-negation,Regex,Regex Negation,考虑一个长的html字符串:我需要有没有特定的标签部分的整个内容 示例: 考虑以下字符串: ;decreasing'>1</a>&nbsp;<span class='active'>2</span><a href='&#2;F;search& ;但是没有运气 ^(?!=(<span class='active'>(.*?)<\/span>)).*$ ^(?!=(.*))*$ [其他信息] 如果我

考虑一个长的html字符串:我需要有没有特定的标签部分的整个内容

示例:

考虑以下字符串:

;decreasing'>1</a>&nbsp;<span class='active'>2</span><a href='&#2;F;search&
;但是没有运气

^(?!=(<span class='active'>(.*?)<\/span>)).*$
^(?!=(.*))*$
[其他信息]

如果我能结合以下两种选择,这将解决问题:

1.选择范围标记之前的所有内容


*?(?=如果您的编码语言允许您执行正则表达式拆分或替换调用,则可以使用以下模式:

~
或像这样展开标记列表:
~


使用正则表达式模式处理html有风险,但它们可能会起作用,也可能不会起作用,这取决于html的结构。

运行此模式的语言/环境是什么?如果我的方法不适用于任何r,为什么不做一个简单的
替换
,然后打印
perl-lpe的///g'文件
伊森,请留下我的意见,并考虑改善你的问题。你好米克马库萨,谢谢你的建议,但如果我没有错,你的正则表达式选择我需要消除的文本。我需要做的是选择所有剩余的文本,除此之外。@偏振光,这就是为什么我建议你使用这个分裂或替换功能。你需要使用HAT语言吗?嗨,我需要使用它和屏幕刮削程序来创建一个子提取器模式。当标签部分的位置在被擦除的多个页面中不断变化时,我需要忽略它,只考虑字符串的其余部分。不幸的是,我不能使用替换函数,只是正则表达式。我设法做到了。t一次,但真的记不起解决方案。:-(@屏幕刮板程序的名称是什么?
;decreasing'>1</a>&nbsp;<a href='&#2;F;search&
^(?!=(<span class='active'>(.*?)<\/span>)).*$
.*?(?=<span)
(?<=span>).*