Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 使用nutch solr从站点抓取所需/精确的数据_Search_Solr_Web Crawler_Fetch_Nutch - Fatal编程技术网

Search 使用nutch solr从站点抓取所需/精确的数据

Search 使用nutch solr从站点抓取所需/精确的数据,search,solr,web-crawler,fetch,nutch,Search,Solr,Web Crawler,Fetch,Nutch,运行nutch时,我会获取所有数据。这是我不想要的。我想根据div类和div id获取数据。我的意思是,我不想获取所有数据,而是根据我的需要获取数据。是否可能???您可能需要检查和@Jayendra:感谢thq快速回复。我遵循了第二个链接(atlantbh.com)我发现这个错误很严重:org.apache.solr.common.SolrException:Document缺少必需的uniqueKey字段:url。然而,当我不打算进行精确的数据提取时,我没有发现这样的错误,solr控制台可以显

运行nutch时,我会获取所有数据。这是我不想要的。我想根据div类和div id获取数据。我的意思是,我不想获取所有数据,而是根据我的需要获取数据。是否可能???

您可能需要检查和@Jayendra:感谢thq快速回复。我遵循了第二个链接(atlantbh.com)我发现这个错误很严重:org.apache.solr.common.SolrException:Document缺少必需的uniqueKey字段:url。然而,当我不打算进行精确的数据提取时,我没有发现这样的错误,solr控制台可以显示结果。为什么精确提取数据时会出现此错误???。请帮助me@Jayendra:文档缺少必需的uniqueKey字段:此错误显示在tomcat solr日志文件中,错误为solr.SolrIndexer-java.io.IOException:作业失败!简而言之,就是日志文件。请帮忙me@KamalKishoreschema.xml配置文件中存在错误。您已将该字段设置为“url”,但尚未将其添加到列表中。@nimeshjm:我已检查过了。该字段以nutch和solr的形式出现在schema.xml中。如果该字段丢失,那么当我没有获取精确数据时(当我获取所有数据时),我也会得到相同的错误。请帮帮我。。