Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
理解apachesolr的一些概念_Solr - Fatal编程技术网

理解apachesolr的一些概念

理解apachesolr的一些概念,solr,Solr,我是Apache solr的新手,有人能举例说明以下术语的含义吗:- Solr核 Solr集合 逻辑索引与物理索引 碎片 我浏览了很多博客文章,但我不理解 术语的使用有点随意,因此您可能会发现一些文本可以互换使用其中一些术语 Solr core core是位于单个服务器上的一组命名文档。一台服务器可以有多个核心。核心可以复制到其他服务器(手动完成时,这是“旧式”复制) Solr系列 集合是一组核心,从一个到。。许多的这是对“这些核心共同构成整个集合”的合乎逻辑的描述。这是SolrCloud引入的

我是Apache solr的新手,有人能举例说明以下术语的含义吗:-

  • Solr核
  • Solr集合
  • 逻辑索引与物理索引
  • 碎片

  • 我浏览了很多博客文章,但我不理解

    术语的使用有点随意,因此您可能会发现一些文本可以互换使用其中一些术语

    Solr core

    core是位于单个服务器上的一组命名文档。一台服务器可以有多个核心。核心可以复制到其他服务器(手动完成时,这是“旧式”复制)

    Solr系列

    集合是一组核心,从一个到。。许多的这是对“这些核心共同构成整个集合”的合乎逻辑的描述。这是SolrCloud引入的,因为这是Solr第一次为您处理集群

    逻辑与物理的对比

    集合是一个逻辑索引,它可以跨越多个核心。每个核心都是一个物理索引(它的磁盘上有Lucene的实际索引文件)。与核心交互时,您与集合交互,而Solr(在SolrCloud模式下)会(通常)对您隐藏集群的所有细节

    切分

    由于集合可以跨越多个核心,所以分片意味着组成单个集合的文档存在于多个核心中。每个核心都是总索引的“碎片”。与复制相比,复制将一个核心的副本分发到多个Solr实例(两个核心中都存在相同的文档,而在切分时,文档仅存在于一个核心中,并且需要所有核心都有一个完整的集合)

    分片是存储单个服务器无法处理的文档(或存储在内存/缓存中以快速响应)的原因

    SolrCloud(由我添加以使这一切合而为一)

    以前(而且,如果您没有使用SolrCloud模式),分片和复制是由用户在查询和配置Solr时手动处理的。您将复制设置为将同一个核心分布在多个服务器上,并使用分片使Solr查询多个Solr实例以获取所有必需的文档。今天,您通常只使用SolrCloud,让Solr抽象掉所有这些细节。在创建一个集合(numShards和replicationFactor)时,您会遇到这些术语,该集合告诉Solr您要将集合分布到多少个Core,以及应该有多少个服务器保存这些Core的副本

    收集->在[1..N]个核心之间分片,复制[0..M]次以实现冗余和更高的查询吞吐量