如何通过scrapy抓取更新的网页？_Scrapy_Web Crawler

如何通过scrapy抓取更新的网页？

scrapy web-crawler

如何通过scrapy抓取更新的网页？,scrapy,web-crawler,Scrapy,Web Crawler,我用scrapy从网站上获取数据。但是有一个问题，我不知道在服务器中更新网站后如何获取增量数据，或者如何知道网站已更新？网页中的表格是我想要抓取的，如下所示：正如您所看到的，有一个名为“adddate”的列。所以当数据更新后，我只想得到最近添加的数据。还有一个问题是，网站的url在更新后不会有任何变化。还是https://gold.jgi.doe.gov/projects 我读过这个问答。我懂一点这个理论。但我仍然不知道在使用scrapy时如何实现这一点，有人能给出一个例子或一些详细信息吗

我用scrapy从网站上获取数据。但是有一个问题，我不知道在服务器中更新网站后如何获取增量数据，或者如何知道网站已更新？网页中的表格是我想要抓取的，如下所示：正如您所看到的，有一个名为“adddate”的列。所以当数据更新后，我只想得到最近添加的数据。还有一个问题是，网站的url在更新后不会有任何变化。还是

https://gold.jgi.doe.gov/projects

我读过这个问答。我懂一点这个理论。但我仍然不知道在使用scrapy时如何实现这一点，有人能给出一个例子或一些详细信息吗

到目前为止你到底试了什么？你能分享一些代码吗？对不起，我不知道如何处理这个问题，所以我想举个例子。按照我知道如何编写蜘蛛来从网站获取数据，但我不知道如何在更新后获取最近添加的数据。@Coding\u Rabbit我想你正在寻找这个