Web crawler 从ApacheNutch清除数据

Web crawler 从ApacheNutch清除数据,web-crawler,nutch,Web Crawler,Nutch,我刚开始使用ApacheNutch,我一直在遵循一些我已经成功使用的教程。现在我想删除在我玩游戏期间收集的所有数据,有没有办法轻松地从Nutch中清除所有下载的数据?纯粹从Nutch端删除通常位于ScrawlDB目录中的所有数据段会让您回到一个干净的状态。如果您已经将数据索引到Solr/ES/等中,那么您可能还希望删除所有这些数据。最后一步可能取决于您使用的存储引擎

我刚开始使用ApacheNutch,我一直在遵循一些我已经成功使用的教程。现在我想删除在我玩游戏期间收集的所有数据,有没有办法轻松地从Nutch中清除所有下载的数据?

纯粹从Nutch端删除通常位于ScrawlDB目录中的所有数据段会让您回到一个干净的状态。如果您已经将数据索引到Solr/ES/等中,那么您可能还希望删除所有这些数据。最后一步可能取决于您使用的存储引擎