使用grep捕获javascript链接
然而,当使用wget创建我的站点的静态副本时,有几个元素需要通过javascript拉入外部资产。脚本的模式应该相当稳定,并且不会动态创建URL。我需要提取的URL如下所示:使用grep捕获javascript链接,javascript,linux,grep,wget,Javascript,Linux,Grep,Wget,然而,当使用wget创建我的站点的静态副本时,有几个元素需要通过javascript拉入外部资产。脚本的模式应该相当稳定,并且不会动态创建URL。我需要提取的URL如下所示: onclick="return ns.homepage.load({e:this, src:'https://mysub.mydomain.tld/somedir/content/123456789.html'})" 我想将这些URL的列表输出到一个本地文件,这样我也可以对它们进行wget。使用perl+HTML::Tr
onclick="return ns.homepage.load({e:this, src:'https://mysub.mydomain.tld/somedir/content/123456789.html'})"
我想将这些URL的列表输出到一个本地文件,这样我也可以对它们进行wget。使用perl+HTML::TreeBuilder提取您的端代码,然后对其进行解析 您可能需要做一些正则表达式的工作,也就是说,这个模块可能只会让您发出“onclick()”事件的声音,但要得到其余的应该不会太糟糕