Web scraping 有和服替代品吗?

Web scraping 有和服替代品吗?,web-scraping,kimono,Web Scraping,Kimono,最近和服实验室宣布他们将关闭这是一个重大的失望,因为我的应用程序在获取数据方面严重依赖这项服务。他们刚刚关闭了这项服务,真令人失望。我一直在使用import.io,但它没有达到和服的标准,缺少一些功能 我想知道是否有类似和服的服务具有以下特点: 计划爬网,即每24小时计划一次爬网,或者您可以调用链接更新爬网的最新数据 批量或单个url爬网,即输入列表或单个url进行爬网 调用链接以获取JSON中爬网的结果 使用单个api键调用api 这些功能大部分都是免费的 或者,我可能会想创建自己的,只是

最近和服实验室宣布他们将关闭这是一个重大的失望,因为我的应用程序在获取数据方面严重依赖这项服务。他们刚刚关闭了这项服务,真令人失望。我一直在使用import.io,但它没有达到和服的标准,缺少一些功能

我想知道是否有类似和服的服务具有以下特点:

  • 计划爬网,即每24小时计划一次爬网,或者您可以调用链接更新爬网的最新数据
  • 批量或单个url爬网,即输入列表或单个url进行爬网
  • 调用链接以获取JSON中爬网的结果
  • 使用单个api键调用api
  • 这些功能大部分都是免费的
或者,我可能会想创建自己的,只是我不想增加我的dev time learning Node.js或Python,这就是为什么我要问这个问题。

更新:2018年12月-现在普遍可用

如果您正在寻找桌面应用程序,Data Scraping Studio与和服中的功能相同,而且更多。或者,您也可以将其安装在windows服务器上,以使您自己的和服++完全替代

仅供参考:我们还计划在2016年4月前推出托管解决方案和REST API

您现在可以在网站(www.datascraping.co)上看到更多详细信息

披露:我是创始成员之一更新日期:2018年12月-现已正式发布

如果您正在寻找桌面应用程序,Data Scraping Studio与和服中的功能相同,而且更多。或者,您也可以将其安装在windows服务器上,以使您自己的和服++完全替代

仅供参考:我们还计划在2016年4月前推出托管解决方案和REST API

您现在可以在网站(www.datascraping.co)上看到更多详细信息


披露:我是创始成员之一披露:我在Portia的创造者Scrapinghub工作

,一个开源的可视化抓取工具,允许您通过指向并单击您试图从中获取数据的网页进行抓取

在上有一个托管版本,您可以免费创建一个帐户并获得:

  • 通过Scrapy Cloud web UI和API计划您的Portia爬行器
  • 使用API获取项目
  • 使用scrapy插件(例如执行增量爬网、将图像下载到s3等)
  • 等等
你可以看到波西亚在行动

[编辑]
你也可以将你的和服实验室项目自动移植到portia,这是我在portia的创建者Scrapinghub工作

,一个开源的可视化抓取工具,允许您通过指向并单击您试图从中获取数据的网页进行抓取

在上有一个托管版本,您可以免费创建一个帐户并获得:

  • 通过Scrapy Cloud web UI和API计划您的Portia爬行器
  • 使用API获取项目
  • 使用scrapy插件(例如执行增量爬网、将图像下载到s3等)
  • 等等
你可以看到波西亚在行动

[编辑]
您还可以使用此

将您的和服实验室项目自动移植到portia。我的团队和我正在开发一个非常类似的工具,我们将很快启动它。以下是关于它的更多信息:

Automatio网络自动化工具,您可以使用它以非常简单的方式从任何网站上刮取数据

其中一些特点是:

  • 预览不同格式的废弃数据,如CSV、JSON、RSS和API。还有下载选项

  • 从相同的数据生成小部件,并获得iframe输出以显示在您的网站上

  • 使用不同的图表类型可视化数据

  • 支持常规分页和无限滚动

  • 调度和循环任务

  • 与其他平台的集成

如果您感兴趣,可以在此处注册早期访问

查看一些视频以查看其实际效果:


我的团队和我正在开发一个非常类似的工具,我们将很快推出它。以下是关于它的更多信息:

Automatio网络自动化工具,您可以使用它以非常简单的方式从任何网站上刮取数据

其中一些特点是:

  • 预览不同格式的废弃数据,如CSV、JSON、RSS和API。还有下载选项

  • 从相同的数据生成小部件,并获得iframe输出以显示在您的网站上

  • 使用不同的图表类型可视化数据

  • 支持常规分页和无限滚动

  • 调度和循环任务

  • 与其他平台的集成

如果您感兴趣,可以在此处注册早期访问

查看一些视频以查看其实际效果:


我在看这个,但没有mac应用程序或api调用获取数据的方法。另外,我没有在服务器上设置它的很多经验,所以我想为我做这件事。另外,你会启动什么?Kimono++或此数据清理工具Hi Tunds,在import.io中,该列表中缺少的唯一功能是定时提取。我很乐意向您展示如何打开功能标志以在导入中启用该功能,以及如果您愿意,如何使用其余的功能。如果你送我一个下午。或电子邮件support@import.io并询问如何安排链接API和批量提取。Mac应用程序目前还没有计划。但我们将启动托管解决方案,您可以登录并启动/安排提取,就像和服一样,还可以使用RESTAPI制作ap