Database 为什么cassandra导入模式较慢

Database 为什么cassandra导入模式较慢,database,import,cassandra,schema,Database,Import,Cassandra,Schema,我导出了我的cassandra的模式。看看这个例子,我的环境在keyspace产品中有40000个表 在新集群中导入这个模式4天后,我只导入了10000个表。正常吗?如何更快地导入此架构?有什么建议吗 首先,认真考虑改变你的数据模型。4万张桌子远远超出了卡桑德拉的设计能力。通常人们被告知在1000左右考虑改变事物。每个表都有大量的开销,这些开销必须保留在内存中,并且有一些操作会触发每个表的任务 虽然您应该对其进行测试,但可以作为一种黑客手段,在启动新集群后将其完全关闭。每个节点都已关闭。然后将s

我导出了我的cassandra的模式。看看这个例子,我的环境在keyspace产品中有40000个表

在新集群中导入这个模式4天后,我只导入了10000个表。正常吗?如何更快地导入此架构?有什么建议吗


首先,认真考虑改变你的数据模型。4万张桌子远远超出了卡桑德拉的设计能力。通常人们被告知在1000左右考虑改变事物。每个表都有大量的开销,这些开销必须保留在内存中,并且有一些操作会触发每个表的任务


虽然您应该对其进行测试,但可以作为一种黑客手段,在启动新集群后将其完全关闭。每个节点都已关闭。然后将system_模式表从任何一个当前节点复制到所有新群集节点。您可能还需要为键空间和表创建文件夹结构。然后启动新的集群。在尝试之前先进行测试,但我相信这将适用于3.x。

旁注:40000!我很惊讶,即使是跑步。这是我听说过的最高点,通常在那之前很久事情就坏了。你是怎么修理的?是的,这很正常。在集群中拥有10k-40k表是不正常的。