Regex 正则表达式不在<;脚本>;标签

Regex 正则表达式不在<;脚本>;标签,regex,regex-lookarounds,Regex,Regex Lookarounds,需要一些正则表达式的帮助。我希望匹配给定HTML字符串中与模式\*[a-z0-9\\\\\+\*匹配的所有内容,该模式不在开始和结束标记之间。我知道这与lookarounds有关,但我不知道如何到达那里。使用regex lookaround。您可以使用: (?!<script>)\*[a-z0-9\_]+\*(?!</script>) (?!)\*[a-z0-9\\\\+\*(?!) 只有在未使用脚本对正则表达式进行前后编码时,它才会与正则表达式匹配 (免责声明)第1

需要一些正则表达式的帮助。我希望匹配给定HTML字符串中与模式
\*[a-z0-9\\\\\+\*
匹配的所有内容,该模式不在
开始和结束标记之间。我知道这与lookarounds有关,但我不知道如何到达那里。

使用regex lookaround。您可以使用:

(?!<script>)\*[a-z0-9\_]+\*(?!</script>)
(?!)\*[a-z0-9\\\\+\*(?!)
只有在未使用脚本对正则表达式进行前后编码时,它才会与正则表达式匹配

(免责声明)第1条规则,不要使用正则表达式解析html


您必须匹配脚本标记以避免它们。
答案在第1组,检查长度,然后其有效

    # <script>.*?</script>|(\*[a-z0-9_]+\*)

    <script> .*? </script>
 |  
    ( \* [a-z0-9_]+ \* )               # (1)
。*(\*[a-z0-9\]+\*)
.*? 
|  
(\*[a-z0-9\]+\*)(1)

您使用的是什么语言?Ruby,但我正在尝试使用纯正则表达式。希望这能奏效。。。这只是一个想法:[^s][^c][^r][^i][^p][^t]*[a-z0-9+*简单方法-先去掉脚本。那根本不起作用?这将匹配任何在匹配之前没有拼写脚本的6个字符。对。。。但是如果脚本标签中有很多javascript呢?@kdeisz你试过了吗?这就是你要求的,顺便说一句,你能用一些我想帮助你的样本数据更新这个问题吗accuracy@kdeisz这个正则表达式所做的是匹配不属于这个正则表达式的内容,如果您有
var a=*abc*
@kdeisz您只需从第一个文件中删除“>”。由于您尚未提供基于常见示例的示例I,我很乐意帮助您准确地获取示例数据。