使用Cassandra评估最小存储磁盘大小

使用Cassandra评估最小存储磁盘大小,cassandra,apache-spark-sql,Cassandra,Apache Spark Sql,我正在对不同的拼花图案和不同的卡桑德拉桌子布局进行分析/比较 其中一个输出是磁盘上的存储大小 我想确保我对Cassandra公平,因此我想确保快照被删除,压缩被“完全”运行 我的数据最初是拼花地板,我用Spark SQL读取,有一个大数据框,然后用Spark Cassandra连接器将其写入C* 我应该运行什么类型的“命令”(假设使用nodetool)来删除快照,运行压缩,然后在我的表的磁盘大小上获得精确的数字?您必须执行nodetool clearnapshot 此命令仅删除由nodetool

我正在对不同的拼花图案和不同的卡桑德拉桌子布局进行分析/比较

其中一个输出是磁盘上的存储大小

我想确保我对Cassandra公平,因此我想确保快照被删除,压缩被“完全”运行

我的数据最初是拼花地板,我用Spark SQL读取,有一个大数据框,然后用Spark Cassandra连接器将其写入C*


我应该运行什么类型的“命令”(假设使用
nodetool
)来删除快照,运行压缩,然后在我的表的磁盘大小上获得精确的数字?

您必须执行
nodetool clearnapshot

此命令仅删除由
nodetool
命令指向的节点中的快照。因此,您必须在每个节点上执行此操作


谢谢,确实是第一步。我如何确保压实完成?与运行
nodetool compactionstats
一样简单?确保压缩完成的唯一方法是执行
nodetool compact
命令。