Java nutch爬虫相对URL问题
有没有人在标准html解析器插件处理相对URL的方式上遇到过问题?有一个地点- 当浏览href设置为的链接时 “?id_r=442&id=41&order=” 浏览器自然会将您带到 但是,简而言之,当从页面解析大纲链接时,链接最终会被删除 这当然是坏的。那么,为什么list_books.asp不见了呢?A已经为此进行了记录。看看。这个补丁帮了我-我在OmniFind中发现了相同的bugJava nutch爬虫相对URL问题,java,lucene,solr,nutch,Java,Lucene,Solr,Nutch,有没有人在标准html解析器插件处理相对URL的方式上遇到过问题?有一个地点- 当浏览href设置为的链接时 “?id_r=442&id=41&order=” 浏览器自然会将您带到 但是,简而言之,当从页面解析大纲链接时,链接最终会被删除 这当然是坏的。那么,为什么list_books.asp不见了呢?A已经为此进行了记录。看看。这个补丁帮了我-我在OmniFind中发现了相同的bug