elasticsearch,limits,Cassandra,elasticsearch,Limits" /> elasticsearch,limits,Cassandra,elasticsearch,Limits" />

Cassandra 弹性搜索的实际限制+;卡桑德拉

Cassandra 弹性搜索的实际限制+;卡桑德拉,cassandra,elasticsearch,limits,Cassandra,elasticsearch,Limits,我计划使用ElasticSearch为我的Cassandra数据库编制索引。我想知道是否有人见过ElasticSearch的实际局限性。在PB的范围内,速度会变慢吗?还有,有人在使用ElasticSearch索引Cassandra时有任何问题吗 从2011年开始,它提到ElasticSearch配置,每个200GB的碎片有1700个,在1/3 PB的范围内。我希望ElasticSearch的架构将支持几乎无限的水平可伸缩性,因为每个碎片索引都与所有其他碎片分开工作 实际限制(也适用于任何其他解决

我计划使用ElasticSearch为我的Cassandra数据库编制索引。我想知道是否有人见过ElasticSearch的实际局限性。在PB的范围内,速度会变慢吗?还有,有人在使用ElasticSearch索引Cassandra时有任何问题吗

从2011年开始,它提到ElasticSearch配置,每个200GB的碎片有1700个,在1/3 PB的范围内。我希望ElasticSearch的架构将支持几乎无限的水平可伸缩性,因为每个碎片索引都与所有其他碎片分开工作


实际限制(也适用于任何其他解决方案)首先包括实际加载那么多数据所需的时间。管理如此规模的Cassandra集群(或任何其他分布式数据存储)还将涉及大量的工作量,仅用于维护、负载平衡等。

kimchy在该线程中提到了这家公司。我们在AWS上跨多个ES集群拥有超过PB的数据。在技术上并没有限制你可以在水平方向上缩放胚胎的距离,但正如DNA所提到的,存在一些实际问题。目前最大的是网络。它适用于所有分布式数据存储。一次只能在导线上移动这么多。当ES必须从故障中恢复时,它必须移动数据。最好的选择是在更多节点上使用更小的碎片(更并发的传输),但您可能会面临更高的失败率和每个字节的exhobiant成本。

如DNA所述,1700个碎片,但不是1700个碎片,而是1700个索引,每个索引有1个碎片和1个副本。因此,这1700个索引很可能不存在于单台机器上,而是在多台机器上拆分。
所以这从来都不是问题

我现在开始与Elisandra(Elasticsearch+Cassandra)合作

我也有问题,索引卡桑德拉与弹性搜索。我的问题基本上是节点配置

执行
$nodetool status
您可以看到
主机ID
,然后破坏:

curl-XGEThttp://localhost:9200/_cluster/state/?pretty=true


您可以检查其中一个
节点:
是否与
主机ID同名

谢谢您的回复。这很有帮助。这不是答案