理解apachesolr的一些概念_Solr

理解apachesolr的一些概念

solr

理解apachesolr的一些概念,solr,Solr,我是Apache solr的新手，有人能举例说明以下术语的含义吗：- Solr核 Solr集合逻辑索引与物理索引碎片我浏览了很多博客文章，但我不理解术语的使用有点随意，因此您可能会发现一些文本可以互换使用其中一些术语 Solr core core是位于单个服务器上的一组命名文档。一台服务器可以有多个核心。核心可以复制到其他服务器（手动完成时，这是“旧式”复制） Solr系列集合是一组核心，从一个到。。许多的这是对“这些核心共同构成整个集合”的合乎逻辑的描述。这是SolrCloud引入的

我是Apache solr的新手，有人能举例说明以下术语的含义吗：-

Solr核

Solr集合

逻辑索引与物理索引

碎片

我浏览了很多博客文章，但我不理解

术语的使用有点随意，因此您可能会发现一些文本可以互换使用其中一些术语

Solr core

core是位于单个服务器上的一组命名文档。一台服务器可以有多个核心。核心可以复制到其他服务器（手动完成时，这是“旧式”复制）

Solr系列

集合是一组核心，从一个到。。许多的这是对“这些核心共同构成整个集合”的合乎逻辑的描述。这是SolrCloud引入的，因为这是Solr第一次为您处理集群

逻辑与物理的对比

集合是一个逻辑索引，它可以跨越多个核心。每个核心都是一个物理索引（它的磁盘上有Lucene的实际索引文件）。与核心交互时，您与集合交互，而Solr（在SolrCloud模式下）会（通常）对您隐藏集群的所有细节

切分

由于集合可以跨越多个核心，所以分片意味着组成单个集合的文档存在于多个核心中。每个核心都是总索引的“碎片”。与复制相比，复制将一个核心的副本分发到多个Solr实例（两个核心中都存在相同的文档，而在切分时，文档仅存在于一个核心中，并且需要所有核心都有一个完整的集合）

分片是存储单个服务器无法处理的文档（或存储在内存/缓存中以快速响应）的原因

SolrCloud（由我添加以使这一切合而为一）

以前（而且，如果您没有使用SolrCloud模式），分片和复制是由用户在查询和配置Solr时手动处理的。您将复制设置为将同一个核心分布在多个服务器上，并使用分片使Solr查询多个Solr实例以获取所有必需的文档。今天，您通常只使用SolrCloud，让Solr抽象掉所有这些细节。在创建一个集合（numShards和replicationFactor）时，您会遇到这些术语，该集合告诉Solr您要将集合分布到多少个Core，以及应该有多少个服务器保存这些Core的副本

收集->在[1..N]个核心之间分片，复制[0..M]次以实现冗余和更高的查询吞吐量