是否可以在Solr返回的文档中获取关键字

是否可以在Solr返回的文档中获取关键字,solr,Solr,Solr提供了一种基于关键字搜索文档的简单方法,但我想知道它是否能够自己返回关键字 例如,我可能想搜索上周Joe博客创建的所有文档,然后通过其中的关键字来感受这些文档的内容。或者我必须自己算出关键词并保存在字段中吗?您所要求的是被称为“”。Solr对此没有现成的支持。但是,您可以集成其他工具来实现这一点 ApacheMahout支持,可用于主题建模。有几个将Solr与Mahout集成的示例。这是 (非结构化信息管理应用程序。)我不必费心打字。相反,这里有一个例子 您所要求的是被称为“”的内容。

Solr提供了一种基于关键字搜索文档的简单方法,但我想知道它是否能够自己返回关键字


例如,我可能想搜索上周Joe博客创建的所有文档,然后通过其中的关键字来感受这些文档的内容。或者我必须自己算出关键词并保存在字段中吗?

您所要求的是被称为“”。Solr对此没有现成的支持。但是,您可以集成其他工具来实现这一点

  • ApacheMahout支持,可用于主题建模。有几个将Solr与Mahout集成的示例。这是

  • (非结构化信息管理应用程序。)我不必费心打字。相反,这里有一个例子


您所要求的是被称为“”的内容。Solr对此没有现成的支持。但是,您可以集成其他工具来实现这一点

  • ApacheMahout支持,可用于主题建模。有几个将Solr与Mahout集成的示例。这是

  • (非结构化信息管理应用程序。)我不必费心打字。相反,这里有一个例子


假设您所说的关键字是指Solr在解析特定字段时生成的标记,那么您可能需要查看文档和示例以了解这些标记

在实现它之前,只需检查Solr(4+)Admin WebUI的分析屏幕,因为它有一个部分显示特定字段实际生成的术语/标记

如果这些不是您试图生成的关键字,您可能需要有一个单独的字段来生成这些关键字,可能需要在索引管道中使用


最后,如果您想体验一下如何进行某种集群,您可能想看看,它已经做到了这一点并与Solr集成

假设关键字是指Solr在解析特定字段时生成的标记,那么您可能需要查看文档和示例以了解这些标记

在实现它之前,只需检查Solr(4+)Admin WebUI的分析屏幕,因为它有一个部分显示特定字段实际生成的术语/标记

如果这些不是您试图生成的关键字,您可能需要有一个单独的字段来生成这些关键字,可能需要在索引管道中使用


最后,如果您想体验一下如何进行某种集群,您可能想看看,它已经做到了这一点并与Solr集成

你这里说的“关键字”是什么意思?对于包含5个单词的短语,solr可能会创建一个索引,其中包含几十个、数百个甚至数千个(基于应用的分析器/标记化器)标记,这些标记应与搜索关键字匹配。。对于普通用户来说,其中很多都没有任何意义。或者你是想提供匹配的字段片段,哪个是?或者你的意思是solr应该“猜测”内容关键字?(如主题、类别等)。您这里所说的“关键字”是什么意思?对于包含5个单词的短语,solr可能会创建一个索引,其中包含几十个、数百个甚至数千个(基于应用的分析器/标记化器)标记,这些标记应与搜索关键字匹配。。对于普通用户来说,其中很多都没有任何意义。或者你是想提供匹配的字段片段,哪个是?或者你的意思是solr应该“猜测”内容关键字?(例如主题、类别等)。谢谢-这正是我想要的。从感觉上看,我真的在思考一些关于趋势主题的东西,而像carrot2这样的东西所产生的集群似乎正好给了我这个答案。术语向量分量也是一个很好的回退。谢谢-这正是我想要的。从感觉上看,我真的在思考一些关于趋势主题的东西,而像carrot2这样的东西所产生的集群似乎正好给了我这个答案。术语vector组件也是一个很好的回退。UIMA/Solr集成看起来很有趣,但默认情况下需要使用Alchemy API和Open Calais()的帐户,这并不理想。但您的想法让我想到了《驯服文本》一书,其中第8章(在上是一个免费示例)演示了与OpenNLP类似的内容。UIMA/Solr集成看起来很有趣,但默认设置依赖于使用Alchemy API和OpenCalais()创建帐户,这并不理想。但是你的想法让我想到了《驯服文本》一书,其中第8章(在上是一个免费示例)展示了与OpenNLP类似的内容。