Amazon ec2 运行TitanDB群集的EC2实例类型

Amazon ec2 运行TitanDB群集的EC2实例类型,amazon-ec2,cassandra,titan,Amazon Ec2,Cassandra,Titan,我目前正在着手建立一个图形数据库。为此,我使用Titan 1.0和Cassandra 2.1.12作为存储后端。目前,我将依靠Titan的内部机制进行索引,不会添加任何外部索引服务,如elasticsearch 对于一般情况,图形将用于:目前,图形应主要包含我的用户群的友谊和追随者关系。关于读写负载,我怀疑有一些写负载(例如,当用户批量添加很多朋友时),同时也有很多读操作(例如,用户想要他的朋友列表) 今天我运行了一些负载测试,发现Titan输出的指标多次出现峰值。 我想知道什么样的EC2实例

我目前正在着手建立一个图形数据库。为此,我使用Titan 1.0和Cassandra 2.1.12作为存储后端。目前,我将依靠Titan的内部机制进行索引,不会添加任何外部索引服务,如elasticsearch

对于一般情况,图形将用于:目前,图形应主要包含我的用户群的友谊和追随者关系。关于读写负载,我怀疑有一些写负载(例如,当用户批量添加很多朋友时),同时也有很多读操作(例如,用户想要他的朋友列表)

今天我运行了一些负载测试,发现Titan输出的指标多次出现峰值。


我想知道什么样的EC2实例最适合运行Titan?现在我使用的是r3.large,但我想知道,如果CPU优化的实例多一点,效果会更好吗?对于不同的实例类型有什么基准吗?

因为你的问题的答案有点主观,所以我将为你指出文章的方向。本文作者提供了m4.large和m4.2xlarge与Titan堆栈之间的比较

如您所见,从一个m4.large(2 vCPU,8 GiB内存)实例移动 对于m4.2xlarge(8个vCPU,32 GiB),性能仅提高9% 运行此特定查询时,显示它不受 内存或CPU


他指出,让多个实例运行单个服务将允许进行细粒度调优。一旦体系结构投入生产,这将对您有所帮助,因为预期的读/写百分比未知。我认为,将服务拆分到特定实例将使您能够自由地调整堆栈,而不是简单地移动到更大的实例。

当您说运行Titan时,您能否澄清并提供负载的详细信息?例如,实例是读重还是写重。我在上面编辑了我的文章,长话短说,我希望两者都读,但可能读得更多。无论如何,我计划在ELB后面建立一个多机集群。很好的链接,非常感谢!尽管如此,您是否知道执行时间的峰值会从何而来?在我看来,真的像是一些后台机制在周期性地做一些事情,因为负载应该是非常恒定的。你是如何管理负载测试的?如果给定的查询遍历多条边或JVM启动垃圾收集,则可能会出现峰值。