Nutch解析插件和重定向

Nutch解析插件和重定向,nutch,web-crawler,Nutch,Web Crawler,我使用的是Nutch2.0,我创建了一个用于解析html的插件,该插件实现了解析器,并且运行良好 问题是我还需要“解析”生成重定向(301300)的页面,以获取url和http代码。我的插件会忽略重定向的页面 你知道我如何获得这些信息吗,也许是通过其他扩展点?我已经实现了协议扩展点,现在我可以在数据库中保存重定向和加载时间

我使用的是Nutch2.0,我创建了一个用于解析html的插件,该插件实现了解析器,并且运行良好

问题是我还需要“解析”生成重定向(301300)的页面,以获取url和http代码。我的插件会忽略重定向的页面


你知道我如何获得这些信息吗,也许是通过其他扩展点?

我已经实现了协议扩展点,现在我可以在数据库中保存重定向和加载时间