SolrCloud的可扩展性是否扩展到索引?

SolrCloud的可扩展性是否扩展到索引?,solr,lucene,solrcloud,Solr,Lucene,Solrcloud,在我所看到的所有文献中,SolrCloud的可伸缩性似乎只涉及查询。这意味着,复制和分片将客户端查询的负载分配到更大的CPU和更宽的带宽上 但是索引呢 SolrCloud的可伸缩性是否提高了索引性能?是否可以将其配置为加快索引时间?在我的例子中,我们需要经常向索引提交新内容;那个特殊情况会改变什么吗 马克·米勒(MarkMiller)的《2012年卢森革命》(Lucene Revolution 2012)很吸引人,涵盖了索引的一些细节。但似乎某些云功能(如复制)可能会使索引速度变慢,而不是变快。

在我所看到的所有文献中,SolrCloud的可伸缩性似乎只涉及查询。这意味着,复制和分片将客户端查询的负载分配到更大的CPU和更宽的带宽上

但是索引呢

SolrCloud的可伸缩性是否提高了索引性能?是否可以将其配置为加快索引时间?在我的例子中,我们需要经常向索引提交新内容;那个特殊情况会改变什么吗


马克·米勒(MarkMiller)的《2012年卢森革命》(Lucene Revolution 2012)很吸引人,涵盖了索引的一些细节。但似乎某些云功能(如复制)可能会使索引速度变慢,而不是变快。有人试过SolrCloud吗?

好吧,我终于能够建立一个合适的云环境进行测试,简单地说,即使使用RAMDirectory,索引速度也是注定的。我不知道索引速度是否与云中跟随者的数量或集合的数量有关,但是有1个leader 2 follower结构和8个集合会使索引速度降低4到5倍。我能够在17分钟内索引大约350万个文档,而对于云中的每个实例,使用相同的配置,我只能在17分钟内索引650K个文档。。。我不知道如何加快SolrCloud的索引速度,有点惊讶地看到,我对云的期望一个接一个地被破坏了,因为我在处理云的过程中不断遇到新的bug和问题

如果这也发生在任何其他设置上,我不明白使用cloud for Solr有什么意义。我的意思是,如果索引速度提高这么多,我可以更快地在经典的独立solr实例上重新索引所有内容


如果有人尝试过SolrCloud,或者有人在真实环境中使用过SolrCloud,那么看看SolrCloud的其他体验会非常好

您正在使用哪个版本的solr?自Solr4.8发布以来,SolrCloud非常稳定

您可以通过不频繁地硬提交文档而不是成批提交(即45或60秒后)来提高索引速度。这可以通过solr配置中的自动提交配置来实现-

虽然硬提交可确保将数据刷新到稳定的存储中,但它不会使通过软提交标记实现的更改可见。将“软提交”的值设置为大约90-120秒。此alos可通过solr配置中的软提交配置实现-


我尝试solrcloud已经有一段时间了,但老实说,我不能说我对它感到满意。它有一些奇怪的行为,你可以在这里找到我想出的一个:。为了加快索引速度,您可以使用configs。我不认为solrcloud会影响索引速度,但它通常与配置有关。您的云中有多少节点?你介意分享硬件配置吗?我正在努力提高吞食速度:@RahulSharma我已经很长时间没有测试上述情况,所以不要详细记住配置和硬件:/如果你提出一个有细节的问题,那么也许我可以帮助,或者至少这里的其他人肯定会帮到你…谢谢@Stephan,我问了同样的问题,但到目前为止我还没有得到任何答案-