理解apachesolr的一些概念
我是Apache solr的新手,有人能举例说明以下术语的含义吗:-理解apachesolr的一些概念,solr,Solr,我是Apache solr的新手,有人能举例说明以下术语的含义吗:- Solr核 Solr集合 逻辑索引与物理索引 碎片 我浏览了很多博客文章,但我不理解 术语的使用有点随意,因此您可能会发现一些文本可以互换使用其中一些术语 Solr core core是位于单个服务器上的一组命名文档。一台服务器可以有多个核心。核心可以复制到其他服务器(手动完成时,这是“旧式”复制) Solr系列 集合是一组核心,从一个到。。许多的这是对“这些核心共同构成整个集合”的合乎逻辑的描述。这是SolrCloud引入的
我浏览了很多博客文章,但我不理解 术语的使用有点随意,因此您可能会发现一些文本可以互换使用其中一些术语 Solr core core是位于单个服务器上的一组命名文档。一台服务器可以有多个核心。核心可以复制到其他服务器(手动完成时,这是“旧式”复制) Solr系列 集合是一组核心,从一个到。。许多的这是对“这些核心共同构成整个集合”的合乎逻辑的描述。这是SolrCloud引入的,因为这是Solr第一次为您处理集群 逻辑与物理的对比 集合是一个逻辑索引,它可以跨越多个核心。每个核心都是一个物理索引(它的磁盘上有Lucene的实际索引文件)。与核心交互时,您与集合交互,而Solr(在SolrCloud模式下)会(通常)对您隐藏集群的所有细节 切分 由于集合可以跨越多个核心,所以分片意味着组成单个集合的文档存在于多个核心中。每个核心都是总索引的“碎片”。与复制相比,复制将一个核心的副本分发到多个Solr实例(两个核心中都存在相同的文档,而在切分时,文档仅存在于一个核心中,并且需要所有核心都有一个完整的集合) 分片是存储单个服务器无法处理的文档(或存储在内存/缓存中以快速响应)的原因 SolrCloud(由我添加以使这一切合而为一) 以前(而且,如果您没有使用SolrCloud模式),分片和复制是由用户在查询和配置Solr时手动处理的。您将复制设置为将同一个核心分布在多个服务器上,并使用分片使Solr查询多个Solr实例以获取所有必需的文档。今天,您通常只使用SolrCloud,让Solr抽象掉所有这些细节。在创建一个集合(numShards和replicationFactor)时,您会遇到这些术语,该集合告诉Solr您要将集合分布到多少个Core,以及应该有多少个服务器保存这些Core的副本 收集->在[1..N]个核心之间分片,复制[0..M]次以实现冗余和更高的查询吞吐量