如何仅在Apache solr中使用存储字段统计文档
我使用的是Solr4.10.3。文档使用ApacheNutch2.3编制索引。schema.xml中有一个字段是tstamp,它在索引文档时包含信息。此字段未编制索引,仅存储在solr中。我想统计一下nutch在solr中索引的文档数量。很明显,我必须使用tstamp字段。现在我该怎么做如何仅在Apache solr中使用存储字段统计文档,apache,indexing,solr,nutch,Apache,Indexing,Solr,Nutch,我使用的是Solr4.10.3。文档使用ApacheNutch2.3编制索引。schema.xml中有一个字段是tstamp,它在索引文档时包含信息。此字段未编制索引,仅存储在solr中。我想统计一下nutch在solr中索引的文档数量。很明显,我必须使用tstamp字段。现在我该怎么做 请详细解释。默认的nutch default.xml配置文件没有激活索引more插件。您可以通过将其添加到插件链来启用它 查找plugin.includes属性并将其从 协议http | urlfilter r
请详细解释。默认的nutch default.xml配置文件没有激活索引more插件。您可以通过将其添加到插件链来启用它 查找plugin.includes属性并将其从
协议http | urlfilter regex | parse-(html | tika)| index-(basic | anchor)| indexer solr | scoring opic | urlnormalizer-(pass | regex | basic)
到
协议http | urlfilter regex | parse-(html | tika)| index-(basic | anchor | more)| indexer solr | scoring opic | urlnormalizer-(pass | regex | basic)
索引更多将索引获取日期。
现在,要知道被索引的文档总数,您需要执行Solr查询
所有文档:*:*
过去24小时内编制索引的文档:date:[NOW-1DAY-TO-NOW]