Deployment Cassandra数据中心之间的单向复制
我们建议将Cassandra实现为大型归档解决方案的数据库后端(与读取相比,写入的数量很大)。我们正在寻找有关Cassandra复制和部署策略的信息,以适合我们的用例 卡桑德拉的选择基于以下因素:Deployment Cassandra数据中心之间的单向复制,deployment,cassandra,database-replication,cassandra-3.0,Deployment,Cassandra,Database Replication,Cassandra 3.0,我们建议将Cassandra实现为大型归档解决方案的数据库后端(与读取相比,写入的数量很大)。我们正在寻找有关Cassandra复制和部署策略的信息,以适合我们的用例 卡桑德拉的选择基于以下因素: 支持“写入”操作的大吞吐量—每秒数千次同时写入 工程数据的适用性(主要是时间序列数据) 高可用性,支持连续望远镜操作 工具支持,例如分析、报告 数据估算 每年增长250 TB(系统寿命为50年) 用例 我们有两个数据中心—Operations DC和Analytics DC(用于隔离读写工作负
- 支持“写入”操作的大吞吐量—每秒数千次同时写入
- 工程数据的适用性(主要是时间序列数据)
- 高可用性,支持连续望远镜操作
- 工具支持,例如分析、报告
- 每年增长250 TB(系统寿命为50年)
我认为在您的情况下,“分离”DC是有意义的,例如,一个DC中的键空间不会复制到另一个DC中,只需使用必要的相应复制设置创建键空间即可 或者,您可以将“事务性”加载复制到两个DC中,并拥有一个作业,该作业将定期将数据从“事务性”键空间复制到“分析性”键空间,然后从“事务性”键空间删除数据以释放空间 但是,除非您使用类似DSE的高级复制(但这不是关于DC,而是关于单独的集群),否则就不可能有您所描述的东西
聘请一位在Cassandra存储10+PB方面有一定经验的顾问可能比在互联网问答网站上随机寻求帮助更好。我理解你的建议,Aaron。已经向管理层强调了这一点,他们将继续努力。现在,我们非常感谢专家们的帮助。谢谢亚历克斯。阅读有关DSE的高级复制的信息,这似乎是一个很好的选择。我想澄清我的理解:部署单独的集群——一个集群(边缘集群)负责写操作,另一个集群负责读操作(中心集线器)。-我们可以控制这个复制吗?所谓控制,我指的是在所述时间安排此复制。-如果我们从边缘群集清除数据,它是否也会从中心集线器中删除?-Edge cluster是否对Central Hub的所有数据都具有全面的分析能力?这些问题很有趣,但要回答这些问题,需要更多信息和AdvRep专家的参与。如果您与DataStax联系,组织对这些需求进行更深入的讨论,可能会更好。。。