Nosql Cassandra在EC2上同时读写时崩溃

Nosql Cassandra在EC2上同时读写时崩溃,nosql,cassandra,scalability,pycassa,Nosql,Cassandra,Scalability,Pycassa,我们目前正在2个大型EC2实例上使用2个cassandra节点组成的集群。他们每个人都有大约65克的使用数据。(开发和生产的设置相同) 我们遇到的问题是在生产写入期间-CPU负载变为40+(2核机器),最终机器变得不可用,需要重新启动。我尝试了多种“tunning策略”,例如减少总内存表空间,改变年轻一代中eden空间与生存空间的比率,将较大的对象直接从eden空间复制到老一代,优化压缩以更频繁地运行,使用较小的表(我注意到在崩溃期间,磁盘利用率几乎为零,因此我尝试减少内存使用) 查看cassa

我们目前正在2个大型EC2实例上使用2个cassandra节点组成的集群。他们每个人都有大约65克的使用数据。(开发和生产的设置相同)

我们遇到的问题是在生产写入期间-CPU负载变为40+(2核机器),最终机器变得不可用,需要重新启动。我尝试了多种“tunning策略”,例如减少总内存表空间,改变年轻一代中eden空间与生存空间的比率,将较大的对象直接从eden空间复制到老一代,优化压缩以更频繁地运行,使用较小的表(我注意到在崩溃期间,磁盘利用率几乎为零,因此我尝试减少内存使用)

查看cassandra system.log,我没有看到任何错误或警告。 崩溃期间唯一显示的是StatusLogger输出

如果我在Dev集群上运行write,那么一切都会顺利运行——没有错误,负载最大为1.5-2。 如果我重新启动这两个生产实例,我可以在崩溃发生之前运行读写操作一段时间,否则,如果机器已经运行了2天以上,崩溃将在几分钟内发生

如有任何建议、想法,将不胜感激


感谢链接回dmn询问的第一个问题: