Python 如何计算Cassandra中特定列_族的行键数(阅读详细信息)
我试图将数据从SQL加载到非SQL,即Cassandra。但不知何故,很少有行不匹配。有人能告诉我如何计算Cassandra中某个特定column_族的行键数吗 我尝试了get_count和get_multicount,但是这些方法需要传递键,在我的情况下,我不知道键,而是需要行键的行数。 列表列\u family\u name为我提供了列表,但仅限于100行。有没有办法,,Python 如何计算Cassandra中特定列_族的行键数(阅读详细信息),python,database,count,cassandra,pycassa,Python,Database,Count,Cassandra,Pycassa,我试图将数据从SQL加载到非SQL,即Cassandra。但不知何故,很少有行不匹配。有人能告诉我如何计算Cassandra中某个特定column_族的行键数吗 我尝试了get_count和get_multicount,但是这些方法需要传递键,在我的情况下,我不知道键,而是需要行键的行数。 列表列\u family\u name为我提供了列表,但仅限于100行。有没有办法,, 我可以覆盖100限制。据我所知,无法获取列族的行数。您必须对整个列族执行范围查询 如果cf是您的列族,那么类似的方法应该
我可以覆盖100限制。据我所知,无法获取列族的行数。您必须对整个列族执行范围查询 如果
cf
是您的列族,那么类似的方法应该可以工作:
num\u rows=len(列表(参见get\u range())
但是,指示如果行太多,这可能会导致问题。您可能必须使用
start
和row\u count
分块执行,您可以在不读取所有行的情况下计算Cassandra行
请参阅
cassandraCount()
中的Spark,它可以非常有效地执行此操作。据我所知,无法获取列族的行计数。您必须对整个列族执行范围查询。@jterrace谢谢,您能详细说明一下执行范围查询的情况吗?(最好举个例子)我只想知道,如何在cassandra中使用相应的SQL查询。“从表\u名称中选择计数(行\u键)”谢谢,但它需要很长时间才能执行。仍在研究cassandra(NOSQL)检索数据的效率。我确实同意一次插入数百万条记录的速度更快,但检索速度更快!:(您使用的是randompartitioner吗?即使只有一个节点,您也必须使用partitioner。如果在get_range()中设置column_count=0和filter_empty=False,这将只返回键。此外,get_range返回一个生成器,因此您可以执行类似于“for key,u in get_range():count+=1”的操作。)这样,您就不会一次将整个结果拉入列表。如果这样做,则无需使用“开始”和“行计数”;pycassa将自动分块请求。@Nish filter\u empty仅在pycassa 1.3中添加。您可能有旧版本吗?