使用php保存整个页面源代码
可能重复:使用php保存整个页面源代码,php,Php,可能重复: 我需要使用PHP保存外部链接的页面源代码,就像我们在PC中保存一样。 p、 s:保存的文件夹包含图像和html内容 我尝试了下面的代码…它只是把源代码放在tes.html中,我还需要保存所有图像。所以我们可以脱机访问 <?php include 'curl.php'; $game = load("https://otherdomain.com/"); echo $game; ?> <?php file_put_contents('tes.html', $gam
我需要使用PHP保存外部链接的页面源代码,就像我们在PC中保存一样。
p、 s:保存的文件夹包含图像和html内容 我尝试了下面的代码…它只是把源代码放在tes.html中,我还需要保存所有图像。所以我们可以脱机访问
<?php
include 'curl.php';
$game = load("https://otherdomain.com/");
echo $game;
?>
<?php
file_put_contents('tes.html', $game);
?>
还支持http。例如:
$game = file_get_contents('https://otherdomain.com');
您可以编写自己的解决方案来解析所有CSS、图像和JS链接(并保存它们),也可以检查以下类似问题的答案:您试图做的是镜像网站 我会使用程序
wget
来实现这一点,而不是重新发明轮子
exec( 'wget -mk -w 20 http://www.example.com/' );
见:
只有这样,你才能正确地镜像一个站点。但是如果他们像Ajax一样动态加载内容,那你就倒霉了。这不符合OP的要求抱歉,应该阅读完整的问题……你尝试了什么?只需解析HTML,并获取所需的所有属性。更改
href
属性,以便图像将离线加载,而Robert's your Uncles这不是一项简单的任务,使用curl无法轻松完成。图像位置必须从HTML源解析,获取图像并重写URL。CSS文件、JavaScript文件、背景图像也必须如此。。。有一些命令行工具在这方面做得更好。这是正确的术语!我冒昧地删除了您的问题。wget
是否在没有--页面必备条件的情况下获取样式表和图像?我想,-m
只跟在hrefs后面,这将把所有内容保存在哪里?@Vidya Venkatwget
在当前工作目录中创建一个子目录,域名为。它不会在当前文件夹中保存任何内容…wget安装得很好!事实上,这是该问题的重复。