Aggregate 每日交易网站聚合器

Aggregate 每日交易网站聚合器,aggregate,Aggregate,最近,我遇到了几个网站(例如)提供团购优惠券一站式购物。我想知道这些网站如何从各种日常交易网站获得交易信息。我确信他们没有使用任何API。因为并不是所有的日常交易网站都提供API 他们在刮屏幕吗?或者他们正在使用RSS提要构建自己的数据库? 如果有人知道解决方案,请分享。我将不胜感激 谢谢 我知道这有点陈旧,但我想我会花时间在这里回答你的问题。正如Logan所指出的,Agriya开发的交易聚合脚本通过三种方式从每日交易网站上获取数据: 它在可用的情况下解析RSS提要中的数据 它从诸如Commis

最近,我遇到了几个网站(例如)提供团购优惠券一站式购物。我想知道这些网站如何从各种日常交易网站获得交易信息。我确信他们没有使用任何API。因为并不是所有的日常交易网站都提供API

他们在刮屏幕吗?或者他们正在使用RSS提要构建自己的数据库? 如果有人知道解决方案,请分享。我将不胜感激


谢谢

我知道这有点陈旧,但我想我会花时间在这里回答你的问题。正如Logan所指出的,Agriya开发的交易聚合脚本通过三种方式从每日交易网站上获取数据:

  • 它在可用的情况下解析RSS提要中的数据
  • 它从诸如Commission Junction之类的附属网络提供的XML提要中解析数据
  • 它使用正则表达式从交易网站的HTML页面解析所需数据

  • 选项1和2相当容易实现,但选项3要求您非常擅长格式化正则表达式。您还感到头疼的是,如果交易网站对其HTML代码做了最轻微的更改,则需要重新编写正则表达式。

    我们运行的是澳大利亚最大的交易聚合器。我们使用以下方法获取数据

    • 从站点XML提要解析数据(首选)
    • 解析来自站点RSS提要的数据
    • 定制屏幕刮削

    正如Peter提到的,当站点更改代码时,屏幕抓取可能有点痛苦,但是这种情况并不经常发生。在我们列出的100多个站点中,可能每个月都要更新1到2个站点

    Dealry可能会使用RSS提要或API,因为我所看到的由它们聚合的站点实际上提供RSS提要和API

    其他地点:

    可能会做屏幕抓取,因为我找不到他们聚合的一些站点的RSS提要或API