elasticsearch 分布式环境下的倒排索引构建,elasticsearch,hbase,information-retrieval,elasticsearch,Hbase,Information Retrieval" /> elasticsearch 分布式环境下的倒排索引构建,elasticsearch,hbase,information-retrieval,elasticsearch,Hbase,Information Retrieval" />

elasticsearch 分布式环境下的倒排索引构建

elasticsearch 分布式环境下的倒排索引构建,elasticsearch,hbase,information-retrieval,elasticsearch,Hbase,Information Retrieval,如果必须从头开始构建分布式反向索引,您将使用哪些工具/库/平台?elasticseach(我需要带有日期约束的部分TF)只做了我需要的部分工作,并考虑使用hbase构建一个反向索引,但想知道是否还有一些更明智的选择(我不会将所有内容都放入内存,并将在一开始考虑缓存)。我仍然觉得您的要求很模糊,因此,一些额外的细节将有助于提供更好的答案 如果您需要对刻面和模糊术语匹配的支持,Solr Cloud可能是一个不错的选择。Solr云只是Solr的分布式配置。它的设置比elasticsearch更繁琐,但

如果必须从头开始构建分布式反向索引,您将使用哪些工具/库/平台?elasticseach(我需要带有日期约束的部分TF)只做了我需要的部分工作,并考虑使用hbase构建一个反向索引,但想知道是否还有一些更明智的选择(我不会将所有内容都放入内存,并将在一开始考虑缓存)。

我仍然觉得您的要求很模糊,因此,一些额外的细节将有助于提供更好的答案

如果您需要对刻面和模糊术语匹配的支持,Solr Cloud可能是一个不错的选择。Solr云只是Solr的分布式配置。它的设置比elasticsearch更繁琐,但仍然是一个非常强大和流行的工具

如果您还没有使用HBase,我不确定是否建议您仅为了创建索引而引入它


如果我能更好地理解您的用例和当前环境,可能会给您一个更好的答案。

基本上,我需要跟踪一些标记(unigram和n-gram)的频率随时间的变化,并能够将其纳入相关性公式。我的理解是,Lucene(solr,elasticsearch)无法做到这一点。