--如果在wget中使用了--html扩展名,则不会有clobber仍然覆盖文件?

--如果在wget中使用了--html扩展名,则不会有clobber仍然覆盖文件?,html,wget,overwrite,Html,Wget,Overwrite,我有一个脚本可以下载我所有的Chrome书签。我使用带有--html扩展名的wget,因为有些书签以.php结尾,除非使用--html扩展名选项,否则web浏览器无法打开它们。我遇到的问题是,当我使用--html扩展名和--no-clobber时,由于某种原因,它无法识别大部分文件已经存在,因此它会经历整个重新下载已经存在的内容的过程 例如: wget-nc 运行一次将按预期方式保存文件。如果您再次运行它,它将显示文件已存在,因此无法检索。这就是我所期望的手术 但是,请删除刚刚保存并运行的文件:

我有一个脚本可以下载我所有的Chrome书签。我使用带有--html扩展名的wget,因为有些书签以.php结尾,除非使用--html扩展名选项,否则web浏览器无法打开它们。我遇到的问题是,当我使用--html扩展名和--no-clobber时,由于某种原因,它无法识别大部分文件已经存在,因此它会经历整个重新下载已经存在的内容的过程

例如: wget-nc 运行一次将按预期方式保存文件。如果您再次运行它,它将显示文件已存在,因此无法检索。这就是我所期望的手术

但是,请删除刚刚保存并运行的文件: wget-nc--html扩展
然后再次运行相同的命令。它覆盖文件,而不是说文件已经存在。发生了什么?

添加html后缀后,wget无法告诉您要将其与哪个远程文件进行比较

男子工作组:

======================

--html扩展

如果下载了类型为application/xhtml+xml或text/html的文件 而且URL不以regexp.[Hh][Tt][Mm][Ll]结尾,这是 选项将导致后缀.html附加到本地 文件名。例如,当您镜像 使用.asp页面但需要镜像页面的远程站点 可以在您的股票Apache服务器上查看。另一个很好的用途 这是当你下载CGI生成的材料时。网址 like将另存为arti- cle.cgi?25.html

请注意,以这种方式更改的文件名将每年重新下载一次 当你重新镜像一个站点的时候,因为Wget不能告诉你本地 html文件对应于远程URL X(因为它还不知道 URL生成text/html或application/xhtml+xml类型的输出。要防止重新下载,必须使用-k 和-K,以便将文件的原始版本另存为
X.orig.

我还没有证实这一点,但它听起来是合法的。感谢您抽出时间回答。