Python 如何计算Cassandra中特定列_族的行键数（阅读详细信息）_Python_Database_Count_Cassandra_Pycassa

Python 如何计算Cassandra中特定列_族的行键数（阅读详细信息）

python database cassandra

Python 如何计算Cassandra中特定列_族的行键数（阅读详细信息）,python,database,count,cassandra,pycassa,Python,Database,Count,Cassandra,Pycassa,我试图将数据从SQL加载到非SQL，即Cassandra。但不知何故，很少有行不匹配。有人能告诉我如何计算Cassandra中某个特定column_族的行键数吗我尝试了get_count和get_multicount，但是这些方法需要传递键，在我的情况下，我不知道键，而是需要行键的行数。列表列\u family\u name为我提供了列表，但仅限于100行。有没有办法,，我可以覆盖100限制。据我所知，无法获取列族的行数。您必须对整个列族执行范围查询如果cf是您的列族，那么类似的方法应该

我试图将数据从SQL加载到非SQL，即Cassandra。但不知何故，很少有行不匹配。有人能告诉我如何计算Cassandra中某个特定column_族的行键数吗

我尝试了get_count和get_multicount，但是这些方法需要传递键，在我的情况下，我不知道键，而是需要行键的行数。列表列\u family\u name为我提供了列表，但仅限于100行。有没有办法,，

我可以覆盖100限制。

据我所知，无法获取列族的行数。您必须对整个列族执行范围查询

如果

cf

是您的列族，那么类似的方法应该可以工作：


num\u rows=len（列表（参见get\u range（））

但是，指示如果行太多，这可能会导致问题。您可能必须使用

start

和

row\u count

分块执行，您可以在不读取所有行的情况下计算Cassandra行

请参阅

cassandraCount（）

中的Spark，它可以非常有效地执行此操作。

据我所知，无法获取列族的行计数。您必须对整个列族执行范围查询。@jterrace谢谢，您能详细说明一下执行范围查询的情况吗？（最好举个例子）我只想知道，如何在cassandra中使用相应的SQL查询。“从表\u名称中选择计数（行\u键）”谢谢，但它需要很长时间才能执行。仍在研究cassandra（NOSQL）检索数据的效率。我确实同意一次插入数百万条记录的速度更快，但检索速度更快！：（您使用的是randompartitioner吗？即使只有一个节点，您也必须使用partitioner。如果在get_range（）中设置column_count=0和filter_empty=False，这将只返回键。此外，get_range返回一个生成器，因此您可以执行类似于“for key，u in get_range（）：count+=1”的操作。）这样，您就不会一次将整个结果拉入列表。如果这样做，则无需使用“开始”和“行计数”；pycassa将自动分块请求。@Nish filter\u empty仅在pycassa 1.3中添加。您可能有旧版本吗？