Bash 无人值守wget安全影响
我已经编写了一个简单的脚本,利用wget从网站收集特定的文件类型(.png)。虽然这很有效,但我还是有点担心可能存在的安全风险 目前,wget将只下载扩展名为.png的所有内容,理论上,该网站可能包含已重命名的恶意或垃圾文件 在下载wget之前有没有办法进行一些过滤?我要下载的文件总是共享一些可用于识别它们的特征(PNG图像数据,200 x 300,8位/彩色RGB,非隔行扫描;大小在80-120kB之间) 在下载任何东西之前,spider至少可以按大小对文件进行排序吗?如果是这样的话,我会感谢你的帮助 这可能是在使用file和其他一些命令下载之后完成的,但我想首先避免抓取坏数据——有什么方法可以做到这一点吗?或者可以做类似事情的替代方案Bash 无人值守wget安全影响,bash,cron,wget,Bash,Cron,Wget,我已经编写了一个简单的脚本,利用wget从网站收集特定的文件类型(.png)。虽然这很有效,但我还是有点担心可能存在的安全风险 目前,wget将只下载扩展名为.png的所有内容,理论上,该网站可能包含已重命名的恶意或垃圾文件 在下载wget之前有没有办法进行一些过滤?我要下载的文件总是共享一些可用于识别它们的特征(PNG图像数据,200 x 300,8位/彩色RGB,非隔行扫描;大小在80-120kB之间) 在下载任何东西之前,spider至少可以按大小对文件进行排序吗?如果是这样的话,我会感谢
谢谢你的意见 PNG文件有一个8字节的头,其中包含以下内容:
od
中,您应该会看到如下内容:
$ head -c 8 knox.png | od -c
0000000 211 P N G \r \n 032 \n
我认为这给了你一个很好的测试的基础
我不认为有任何方法可以限制wget部分下载文件,但您可以在curl中完成,例如:
curl -s -r 0-8 "http://www.fnordware.com/superpng/pnggrad8rgb.png" | od -c
0000000 211 P N G \r \n 032 \n \0
0000011