Bash 无人值守wget安全影响

Bash 无人值守wget安全影响,bash,cron,wget,Bash,Cron,Wget,我已经编写了一个简单的脚本,利用wget从网站收集特定的文件类型(.png)。虽然这很有效,但我还是有点担心可能存在的安全风险 目前,wget将只下载扩展名为.png的所有内容,理论上,该网站可能包含已重命名的恶意或垃圾文件 在下载wget之前有没有办法进行一些过滤?我要下载的文件总是共享一些可用于识别它们的特征(PNG图像数据,200 x 300,8位/彩色RGB,非隔行扫描;大小在80-120kB之间) 在下载任何东西之前,spider至少可以按大小对文件进行排序吗?如果是这样的话,我会感谢

我已经编写了一个简单的脚本,利用wget从网站收集特定的文件类型(.png)。虽然这很有效,但我还是有点担心可能存在的安全风险

目前,wget将只下载扩展名为.png的所有内容,理论上,该网站可能包含已重命名的恶意或垃圾文件

在下载wget之前有没有办法进行一些过滤?我要下载的文件总是共享一些可用于识别它们的特征(PNG图像数据,200 x 300,8位/彩色RGB,非隔行扫描;大小在80-120kB之间) 在下载任何东西之前,spider至少可以按大小对文件进行排序吗?如果是这样的话,我会感谢你的帮助

这可能是在使用file和其他一些命令下载之后完成的,但我想首先避免抓取坏数据——有什么方法可以做到这一点吗?或者可以做类似事情的替代方案


谢谢你的意见

PNG文件有一个8字节的头,其中包含以下内容:

  • 137一个字节及其最高有效位集(`8位字符“”)
  • 80便士
  • 78 N
  • 71克
  • 13回车符(CR)字符,也称CTRL-M或^M
  • 10换行符(LF),也称为CTRL-J或^J
  • 26 CTRL-Z或^Z
  • 10换行符(LF),也称为CTRL-J或^J
  • 因此,如果将前8个字节输入到
    od
    中,您应该会看到如下内容:

    $ head -c 8 knox.png | od -c
    0000000  211   P   N   G  \r  \n 032  \n
    
    我认为这给了你一个很好的测试的基础

    我不认为有任何方法可以限制wget部分下载文件,但您可以在curl中完成,例如:

    curl -s -r 0-8 "http://www.fnordware.com/superpng/pnggrad8rgb.png" | od -c
    0000000  211   P   N   G  \r  \n 032  \n  \0
    0000011