<img src="//i.stack.imgur.com/RUiNP.png" height="16" width="18" alt="" class="sponsor tag img">elasticsearch 分布式环境下的倒排索引构建_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch_Hbase_Information Retrieval

elasticsearch 分布式环境下的倒排索引构建

hbase

elasticsearch 分布式环境下的倒排索引构建,elasticsearch,hbase,information-retrieval,elasticsearch,Hbase,Information Retrieval,如果必须从头开始构建分布式反向索引，您将使用哪些工具/库/平台？elasticseach（我需要带有日期约束的部分TF）只做了我需要的部分工作，并考虑使用hbase构建一个反向索引，但想知道是否还有一些更明智的选择（我不会将所有内容都放入内存，并将在一开始考虑缓存）。我仍然觉得您的要求很模糊，因此，一些额外的细节将有助于提供更好的答案如果您需要对刻面和模糊术语匹配的支持，Solr Cloud可能是一个不错的选择。Solr云只是Solr的分布式配置。它的设置比elasticsearch更繁琐，但

如果必须从头开始构建分布式反向索引，您将使用哪些工具/库/平台？elasticseach（我需要带有日期约束的部分TF）只做了我需要的部分工作，并考虑使用hbase构建一个反向索引，但想知道是否还有一些更明智的选择（我不会将所有内容都放入内存，并将在一开始考虑缓存）。

我仍然觉得您的要求很模糊，因此，一些额外的细节将有助于提供更好的答案

如果您需要对刻面和模糊术语匹配的支持，Solr Cloud可能是一个不错的选择。Solr云只是Solr的分布式配置。它的设置比elasticsearch更繁琐，但仍然是一个非常强大和流行的工具

如果您还没有使用HBase，我不确定是否建议您仅为了创建索引而引入它

如果我能更好地理解您的用例和当前环境，可能会给您一个更好的答案。

基本上，我需要跟踪一些标记（unigram和n-gram）的频率随时间的变化，并能够将其纳入相关性公式。我的理解是，Lucene（solr，elasticsearch）无法做到这一点。