Amazon ec2 运行TitanDB群集的EC2实例类型_Amazon Ec2_Cassandra_Titan

Amazon ec2 运行TitanDB群集的EC2实例类型

amazon-ec2 cassandra

Amazon ec2 运行TitanDB群集的EC2实例类型,amazon-ec2,cassandra,titan,Amazon Ec2,Cassandra,Titan,我目前正在着手建立一个图形数据库。为此，我使用Titan 1.0和Cassandra 2.1.12作为存储后端。目前，我将依靠Titan的内部机制进行索引，不会添加任何外部索引服务，如elasticsearch 对于一般情况，图形将用于：目前，图形应主要包含我的用户群的友谊和追随者关系。关于读写负载，我怀疑有一些写负载（例如，当用户批量添加很多朋友时），同时也有很多读操作（例如，用户想要他的朋友列表）今天我运行了一些负载测试，发现Titan输出的指标多次出现峰值。我想知道什么样的EC2实例

我目前正在着手建立一个图形数据库。为此，我使用Titan 1.0和Cassandra 2.1.12作为存储后端。目前，我将依靠Titan的内部机制进行索引，不会添加任何外部索引服务，如elasticsearch

对于一般情况，图形将用于：目前，图形应主要包含我的用户群的友谊和追随者关系。关于读写负载，我怀疑有一些写负载（例如，当用户批量添加很多朋友时），同时也有很多读操作（例如，用户想要他的朋友列表）

今天我运行了一些负载测试，发现Titan输出的指标多次出现峰值。

我想知道什么样的EC2实例最适合运行Titan？现在我使用的是r3.large，但我想知道，如果CPU优化的实例多一点，效果会更好吗？对于不同的实例类型有什么基准吗？

因为你的问题的答案有点主观，所以我将为你指出文章的方向。本文作者提供了m4.large和m4.2xlarge与Titan堆栈之间的比较

如您所见，从一个m4.large（2 vCPU，8 GiB内存）实例移动对于m4.2xlarge（8个vCPU，32 GiB），性能仅提高9% 运行此特定查询时，显示它不受内存或CPU

他指出，让多个实例运行单个服务将允许进行细粒度调优。一旦体系结构投入生产，这将对您有所帮助，因为预期的读/写百分比未知。我认为，将服务拆分到特定实例将使您能够自由地调整堆栈，而不是简单地移动到更大的实例。

当您说运行Titan时，您能否澄清并提供负载的详细信息？例如，实例是读重还是写重。我在上面编辑了我的文章，长话短说，我希望两者都读，但可能读得更多。无论如何，我计划在ELB后面建立一个多机集群。很好的链接，非常感谢！尽管如此，您是否知道执行时间的峰值会从何而来？在我看来，真的像是一些后台机制在周期性地做一些事情，因为负载应该是非常恒定的。你是如何管理负载测试的？如果给定的查询遍历多条边或JVM启动垃圾收集，则可能会出现峰值。