Python 价格比较restful api

Python 价格比较restful api,python,algorithm,web-crawler,scrapy-spider,flask-restful,Python,Algorithm,Web Crawler,Scrapy Spider,Flask Restful,我正在尝试构建一个restful api来比较特定网站的价格。 我从废弃产品名称、价格和产品图像url开始,并将其保存到csv文件中。在这一点上,我有网站A的产品和网站B的产品。 但是,无法知道两个文件中的特定产品是否相同,从而实际比较价格。我的方法是使用一个名为fuzzywuzzy的字符串匹配库,它工作得很好。 我觉得这在这种情况下是不实际的,因为价格不断变化,产品可能会被移除 解决这个问题的更好办法是什么 你真正的问题是什么?你说FuzzyWozzy很好用,那你有什么问题吗?@JohnGor

我正在尝试构建一个restful api来比较特定网站的价格。 我从废弃产品名称、价格和产品图像url开始,并将其保存到csv文件中。在这一点上,我有网站A的产品和网站B的产品。 但是,无法知道两个文件中的特定产品是否相同,从而实际比较价格。我的方法是使用一个名为fuzzywuzzy的字符串匹配库,它工作得很好。 我觉得这在这种情况下是不实际的,因为价格不断变化,产品可能会被移除


解决这个问题的更好办法是什么

你真正的问题是什么?你说FuzzyWozzy很好用,那你有什么问题吗?@JohnGordon它很好用,但我必须每隔几天运行一次刮板机,以保持数据的最新。我想要的是一种自动获取更新的方法,可能是通过使用我不太熟悉的爬行器,也不确定它们是否也能工作。我看不到任何自动获取更新的方法,除非网站提供。我想你每隔几天就得刮一次。你可以从对每个产品进行HEAD请求开始,如果上次修改的日期自上次以来没有改变,你就不必再刮该产品了。在大多数情况下,“为……提供(更好的)解决方案”这样的问题被认为过于宽泛。另一方面,关于特定编程问题的特定问题非常受欢迎。