Regex 正则表达式选择整个字符串,但忽略子字符串匹配
考虑一个长的html字符串:我需要有没有特定的标签部分的整个内容 示例: 考虑以下字符串:Regex 正则表达式选择整个字符串,但忽略子字符串匹配,regex,regex-negation,Regex,Regex Negation,考虑一个长的html字符串:我需要有没有特定的标签部分的整个内容 示例: 考虑以下字符串: ;decreasing'>1</a> <span class='active'>2</span><a href='F;search& ;但是没有运气 ^(?!=(<span class='active'>(.*?)<\/span>)).*$ ^(?!=(.*))*$ [其他信息] 如果我
;decreasing'>1</a> <span class='active'>2</span><a href='F;search&
;但是没有运气
^(?!=(<span class='active'>(.*?)<\/span>)).*$
^(?!=(.*))*$
[其他信息]
如果我能结合以下两种选择,这将解决问题:
1.选择范围标记之前的所有内容
*?(?=如果您的编码语言允许您执行正则表达式拆分或替换调用,则可以使用以下模式:
~
或像这样展开标记列表:~
使用正则表达式模式处理html有风险,但它们可能会起作用,也可能不会起作用,这取决于html的结构。运行此模式的语言/环境是什么?如果我的方法不适用于任何r,为什么不做一个简单的替换,然后打印perl-lpe的///g'文件
伊森,请留下我的意见,并考虑改善你的问题。你好米克马库萨,谢谢你的建议,但如果我没有错,你的正则表达式选择我需要消除的文本。我需要做的是选择所有剩余的文本,除此之外。@偏振光,这就是为什么我建议你使用这个分裂或替换功能。你需要使用HAT语言吗?嗨,我需要使用它和屏幕刮削程序来创建一个子提取器模式。当标签部分的位置在被擦除的多个页面中不断变化时,我需要忽略它,只考虑字符串的其余部分。不幸的是,我不能使用替换函数,只是正则表达式。我设法做到了。t一次,但真的记不起解决方案。:-(@屏幕刮板程序的名称是什么?
;decreasing'>1</a> <a href='F;search&
^(?!=(<span class='active'>(.*?)<\/span>)).*$
.*?(?=<span)
(?<=span>).*