Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/310.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java nutch爬虫相对URL问题_Java_Lucene_Solr_Nutch - Fatal编程技术网

Java nutch爬虫相对URL问题

Java nutch爬虫相对URL问题,java,lucene,solr,nutch,Java,Lucene,Solr,Nutch,有没有人在标准html解析器插件处理相对URL的方式上遇到过问题?有一个地点- 当浏览href设置为的链接时 “?id_r=442&id=41&order=” 浏览器自然会将您带到 但是,简而言之,当从页面解析大纲链接时,链接最终会被删除 这当然是坏的。那么,为什么list_books.asp不见了呢?A已经为此进行了记录。看看。这个补丁帮了我-我在OmniFind中发现了相同的bug

有没有人在标准html解析器插件处理相对URL的方式上遇到过问题?有一个地点- 当浏览href设置为的链接时 “?id_r=442&id=41&order=” 浏览器自然会将您带到

但是,简而言之,当从页面解析大纲链接时,链接最终会被删除

这当然是坏的。那么,为什么list_books.asp不见了呢?

A已经为此进行了记录。看看。

这个补丁帮了我-我在OmniFind中发现了相同的bug