刮取和非API交互
我正在考虑构建一个应用程序来检查各个商店的库存水平。有些商店没有公开此信息的API 我正在考虑为每个网站建立一个刮板 你认为这样行吗?我可以只构建一个脚本来检查所有站点吗?例如,这是来自一个站点的标记:刮取和非API交互,api,web-scraping,Api,Web Scraping,我正在考虑构建一个应用程序来检查各个商店的库存水平。有些商店没有公开此信息的API 我正在考虑为每个网站建立一个刮板 你认为这样行吗?我可以只构建一个脚本来检查所有站点吗?例如,这是来自一个站点的标记: <div class = "stock status6"> <b> In stock </b> </div> 所以我的脚本需要解析它来提取股票信息 据我所知,这种技术的问题在于,如果站点更改了标记,那么我的刮板可能会停止工作 当一个API不可
<div class = "stock status6">
<b> In stock </b>
</div>
所以我的脚本需要解析它来提取股票信息
据我所知,这种技术的问题在于,如果站点更改了标记,那么我的刮板可能会停止工作
当一个API不可用时,我如何获得使用该API的好处?Javascript能在这里提供帮助吗
我正在考虑为每个网站建立一个刮板
当您无法访问API时,这是您唯一的选择
你认为这样行吗?我可以只构建一个脚本来检查所有站点吗
刮削是解决此类问题的一种非常常见的方法。如何构造脚本在这里是一个细节,但是每个站点可能需要以不同的方式进行解析
据我所知,这种技术的问题在于,如果站点更改了标记,那么我的刮板可能会停止工作
是的,您需要准备好在页面更改时更新脚本,或者在数据不可用时从其他来源获取数据
当一个API不可用时,我如何获得使用该API的好处?Javascript能在这里提供帮助吗
刮取是一个很难维护的问题,很少像API那样可靠
客户端Javascript无法用于刮取数据,因为存在错误。如果从服务器运行,则可以使用Javascript构建刮板