刮掉整个网页+;css+;javascript
我正在尝试创建网页版本控制备份/日志。如果网页(包括JS和CSS)被更改,它会在驱动器上保存一个静态副本 如何刮掉整个网页+;css+;javascript,javascript,css,go,web-scraping,Javascript,Css,Go,Web Scraping,我正在尝试创建网页版本控制备份/日志。如果网页(包括JS和CSS)被更改,它会在驱动器上保存一个静态副本 如何获取网页的CSS和javascript?获取HTML很容易,只需连接到网页,阅读内容并返回即可。但是我如何获得这个页面的CSS和Javascript呢 系统无法直接访问Web服务器,因此我必须通过网络远程执行所有操作 我的想法是,我搜索我搜索到的HTML.css和.js',然后把所有内容都带到第一个引号“,然后直接访问css/javascript文件作为网页。但我认为这可能不是很可靠 不
获取网页的CSS和javascript?获取HTML很容易,只需连接到网页,阅读内容并返回即可。但是我如何获得这个页面的CSS和Javascript呢
系统无法直接访问Web服务器,因此我必须通过网络
远程执行所有操作
我的想法是,我搜索我搜索到的HTML.css
和.js',然后把所有内容都带到第一个引号“
,然后直接访问css/javascript文件作为网页。但我认为这可能不是很可靠
不知道为什么这个标记太宽了。我在问如何获得网页的CSS和javascript。我对我的问题进行了改革,希望现在更好。与其搜索.js
和.CSS
,不如找
和
标记,并使用它们的src
和href
属性分别执行另一个网络请求并检索这些文件以进行比较
这将更加可靠,因为您不必担心页面内容包含js
或css
,而且您还可以使用XML解析器来确保单引号与双引号之类的内容不会成为问题