Command line 如何忽略要在wget中下载的特定类型的文件?
如何忽略Command line 如何忽略要在wget中下载的特定类型的文件?,command-line,wget,Command Line,Wget,如何忽略wget中的.jpg,.png文件,因为我只想包含.html文件 我正在努力: wget -R index.html,*tiff,*pdf,*jpg -m http://example.com/ 但它不起作用。使用 --reject jpg,png --accept html 要排除/包括具有特定扩展名的文件的选项,请参见 将带有通配符的模式放在引号中,否则shell将展开它们,请参见 例如: wget -r -nH -nd -np -A "*.html" -R "*.gz,
wget
中的.jpg
,.png
文件,因为我只想包含.html
文件
我正在努力:
wget -R index.html,*tiff,*pdf,*jpg -m http://example.com/
但它不起作用。使用
--reject jpg,png --accept html
要排除/包括具有特定扩展名的文件的选项,请参见
将带有通配符的模式放在引号中,否则shell将展开它们,请参见
例如:
wget -r -nH -nd -np -A "*.html" -R "*.gz, *.tar" http://www1.ncdc.noaa.gov/pub/data/noaa/1990/
下载除归档文件以外的所有文件的示例:
wget -r -k -l 7 -E -nc \
-R "*.gz, *.tar, *.tgz, *.zip, *.pdf, *.tif, *.bz, *.bz2, *.rar, *.7z" \
-erobots=off \
--user-agent="Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36" \
http://misis.ru/
wget*.html-mhttp://web.123.org
?离题题题。这个问题与为什么答案的-1重复了一半?我没有发布,但我不明白为什么会被否决。不知道,我一直在寻找-nd选项,它没有在手册的“递归检索选项”中列出,所以Upvoted我认为-A*.html
是一个错误——它将被shell扩展。我应该是-A“*.html”
。如果本地文件与*
匹配,则shell可能会截取所有未加引号的*
用法,并应加引号。
wget -r -k -l 7 -E -nc \
-R "*.gz, *.tar, *.tgz, *.zip, *.pdf, *.tif, *.bz, *.bz2, *.rar, *.7z" \
-erobots=off \
--user-agent="Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36" \
http://misis.ru/