在html文件中查找JavaScript脚本
我一个字符一个字符地遍历整个html文件,我想得到html标记 如果我遇到了'作为它的结束。当然,JavaScript脚本内部可以有“”,因此当它们出现时,我的程序会将它们视为所需标记。我想避免这样的错误 是否有任何正则表达式,我可以使用或任何想法来做这件事?在html文件中查找JavaScript脚本,javascript,html,regex,Javascript,Html,Regex,我一个字符一个字符地遍历整个html文件,我想得到html标记 如果我遇到了'作为它的结束。当然,JavaScript脚本内部可以有“”,因此当它们出现时,我的程序会将它们视为所需标记。我想避免这样的错误 是否有任何正则表达式,我可以使用或任何想法来做这件事? 我尝试使用JavaScript编程语言关键字检查脚本,但这种方法无法说服我。很抱歉,我没有真正理解您想要的内容,但是如果您想在html中获取任何标记或所有标记及其代码,您可以使用document.queryselectoral(“标记名”
我尝试使用JavaScript编程语言关键字检查脚本,但这种方法无法说服我。很抱歉,我没有真正理解您想要的内容,但是如果您想在html中获取任何标记或所有标记及其代码,您可以使用
document.queryselectoral(“标记名”)[0]。outerHTML
数组0表示它是首次创建的,使用for循环逐个获取所有。。。如果这不是您想要的,我很抱歉…请参阅。使用DOM解析器。你要做的是非常困难的,因为你可以在javascript代码中找到字符
:1)比较,2)字符串,3)注释(内联和多行),4)文字正则表达式模式(祝你好运),5)位移位运算符,不要忘记最终的css字符串和注释。简而言之,你不能用一个简单的模式来处理这个问题。JS已有HTML解析器,你为什么要从头开始编写呢?如果是服务器端,我建议使用cheerio.JS