Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/379.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/88.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 如何克隆网页及其css元素和脚本?_Javascript_Html_Css_Web Scraping_Beautifulsoup - Fatal编程技术网

Javascript 如何克隆网页及其css元素和脚本?

Javascript 如何克隆网页及其css元素和脚本?,javascript,html,css,web-scraping,beautifulsoup,Javascript,Html,Css,Web Scraping,Beautifulsoup,我一直在尝试克隆一个网页,比如Instagram的登录页面及其css元素和本地javascript 比如,我想在我的测试服务器上复制和托管登录页面,同时使其正常工作,就像它连接到互联网一样 我希望将元素保存在本地,这样我就可以运行此测试服务器,而无需连接到internet 我如何做到这一点 我了解python,也尝试过一些Beautfulsoup,但我对它不太在行。你只要试试HTTrack HTTrack是一款免费的开源网络爬虫和离线浏览器 HTTrack允许用户从 将Internet连接到本

我一直在尝试克隆一个网页,比如Instagram的登录页面及其css元素和本地javascript

比如,我想在我的测试服务器上复制和托管登录页面,同时使其正常工作,就像它连接到互联网一样

我希望将元素保存在本地,这样我就可以运行此测试服务器,而无需连接到internet

我如何做到这一点


我了解python,也尝试过一些Beautfulsoup,但我对它不太在行。

你只要试试HTTrack

  • HTTrack是一款免费的开源网络爬虫和离线浏览器
  • HTTrack允许用户从 将Internet连接到本地计算机

更多参考

如果您使用的是linux或任何风格的linux,则可以运行此命令

wget www.websitename.com
如果您使用的是windows机器,则需要安装并配置它


这里是帮助

您可以在页面上单击鼠标右键并选择“另存为”。。从上下文菜单中。别忘了保存为类型网页完成。如果你不想使用其他软件。HTTTrack是一个很好的选择。
BeautifulSoup只是一个网页抓取工具。

这个问题属于reddit和其他论坛。因为你没有代码来解决。@Dejan.S没有,我没有;I don’我不同意你正在寻找一份基于建议和意见的建议。您没有为“网络抓取”或其他任何不起作用的代码。阅读关于发布的规则。非常清楚。不,页面只是停留在instagram的徽标上,而不是进入登录页面。这似乎是一个机器人检查或something@Greatguy如果你保存页面,你将得到你想要的一切。“页面只是停留在instagram徽标上”是什么意思?你希望你可以登录到你的本地机器上,进入真正的页面吗?@Greatguy,如果你保存了页面,你就得到了css,你必须取消它,复制你需要的类,并检查元素以获得类。这在这个特定的页面上有点困难,因为他们使用react,这就是保存页面时没有html的原因。在您的例子中,如果您只想复制输入框及其父块的样式,只需打开devtools并从那里复制它,就得到了html和css。大约需要15分钟。不需要使用工具和循环,也不需要花费10多个小时。注意语言和语调。@Dejan.S很抱歉,我已经试了两天,但一无所获:(css类?),非常感谢!我写了一个答案,它会将它标记为这个问题的答案,再次,对不起burst@GreatguyInstagram有点“复杂”如果你不知道,我明白了。我会这样做,打开devtools,检查你需要获取css的任何元素,如果你右键单击父元素到你想要的>编辑为html,你可以复制粘贴该特定部分的完整html。然后用inspect一个接一个地获取css,如(请注意,下面的css可能与所选的css相关)该页面仅保留在instagram徽标上。该页面仅保留在instagram徽标上。虽然此链接可能会回答问题,但最好在此处包含答案的基本部分,并提供链接供参考。如果链接页面发生更改,则仅链接的答案可能无效-