Curl 如何从URL未定义文件名的网页下载所有列出的文件_Curl_Web Scraping_Wget

Curl 如何从URL未定义文件名的网页下载所有列出的文件

curl web-scraping

Curl 如何从URL未定义文件名的网页下载所有列出的文件,curl,web-scraping,wget,Curl,Web Scraping,Wget,我想从本页下载所有数据集：我尝试过wget，但挑战在于：链接到文件的URL中没有文件名，它们可能具有不同的文件类型以下是指向文件的URL示例：模式是所有URL都以http://www.data.gov/download/开头，以/geodata结尾什么是最好的方式做刮这个网站？我应该使用wget、cURL、PHP脚本或其他什么吗？为什么wget在这种情况下不起作用？基于您的示例URL，递归wget检索将把每个下载的文件放入其自己目录中的文件地理数据中。一旦数据放在本地磁盘上，您就可以按

我想从本页下载所有数据集：

我尝试过wget，但挑战在于：

链接到文件的URL中没有文件名，它们可能具有不同的文件类型

以下是指向文件的URL示例：

模式是所有URL都以http://www.data.gov/download/开头，以/geodata结尾

什么是最好的方式做刮这个网站？我应该使用wget、cURL、PHP脚本或其他什么吗？

为什么wget在这种情况下不起作用？基于您的示例URL，递归wget检索将把每个下载的文件放入其自己目录中的文件地理数据中。一旦数据放在本地磁盘上，您就可以按照自己的意愿处理数据，包括重命名文件并将其移动到更方便的形式，例如使用mmv或find-exec命令。

我仍在想这一点，因此任何评论或建议都将不胜感激！