Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/http/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Http 使用httrack镜像单个页面_Http_Command Line_Httrack - Fatal编程技术网

Http 使用httrack镜像单个页面

Http 使用httrack镜像单个页面,http,command-line,httrack,Http,Command Line,Httrack,我试图使用httrack()来下载单个页面,而不是整个站点。因此,例如,当使用httrack下载www.google.com时,它应该只下载在www.google.com下找到的html以及所有样式表、图像和javascript,而不跟随任何指向images.google.com、labs.google.com或www.google.com/subdir/等的链接 我尝试了-w选项,但没有任何区别 正确的命令是什么 编辑 我尝试使用httrack“http://www.google.com/“-

我试图使用httrack()来下载单个页面,而不是整个站点。因此,例如,当使用httrack下载www.google.com时,它应该只下载在www.google.com下找到的html以及所有样式表、图像和javascript,而不跟随任何指向images.google.com、labs.google.com或www.google.com/subdir/等的链接

我尝试了
-w
选项,但没有任何区别

正确的命令是什么

编辑

我尝试使用
httrack“http://www.google.com/“-O”。/www.google.com”http://www.google.com/“-v-s0--depth=1
但它不会复制任何图像


我基本上只想下载该域的索引文件以及所有资产,而不是任何外部或内部链接的内容。

HTTTrack的目的是跟踪链接。尝试设置
--ext depth=0

查看示例:

httrack "http://www.all.net/" -O "/tmp/www.all.net" "+*.all.net/*" -v
最后一部分是正则表达式。只要做一个完全匹配的正则表达式

httrack "http://www.google.com.au/" -O "/tmp/www.google.com.au" "+*.google.com.au/*" -v ---depth=2 --ext-depth=2

我必须本地化,否则我会得到一个重定向页面。你应该本地化到你被引导到的谷歌上。

你能用wget代替httrack吗
wget-p
将下载单个页面及其所有“先决条件”(图像、样式表)

-n选项(或--near)将下载网页上的图像,无论它位于何处

假设图像位于google.com/foo/bar/logo.png。由于您使用的是s0(保持在同一目录),除非您指定--near

  • 点击“设置选项”
  • 转到“限制”选项卡
  • 将“最大外部深度”设置为0

这有帮助,但并不完全正确。你能看看我的编辑吗?这似乎是复制图像和js。你的参数中有多余的
-
。如果httrack不能完成这项工作,wget将是我的备用解决方案。关于
httrack
的问题,请继续关注。如果资源有查询字符串,wget不会执行JS
wget
失败。它下载使用querystring本身命名的文件。
wget
对于某些站点/页面无法正常工作。我需要按照@torger下面的回答使用
httrack
,以获得所有必需的CSS文件并更正链接。
httrack "http://www.google.com/" -O "./www.google.com" "http://www.google.com/" -v -s0  --depth=1 -n