在Cassandra中,有没有一种方法可以通过集群密钥高效地获取前n个最小数据点?
我知道,对于Cassandra,数据仅按分区键在集群键上排序在Cassandra中,有没有一种方法可以通过集群密钥高效地获取前n个最小数据点?,cassandra,Cassandra,我知道,对于Cassandra,数据仅按分区键在集群键上排序 我想知道卡桑德拉是否对全局扫描进行了优化。假设cluster键是一个整数值,如果我想搜索Cassandra集群上的所有数据以查找值为
我想知道卡桑德拉是否对全局扫描进行了优化。假设cluster键是一个整数值,如果我想搜索Cassandra集群上的所有数据以查找值为
<3
的集合。Cassandra查询引擎在遇到数字=3
后,不需要继续查看分区中的集合。是否有Cassandra提供的API(如CDK)可以执行这些优化?按分区键查询是Cassandra中查询的最佳方式。如果您想使用集群键进行查询,那么可以使用“允许筛选”选项但建议不要在生产中使用“允许筛选”。
要扫描整个表并过滤一些数据,您可以使用spark来完成工作。为什么还要麻烦C*呢?它不是专门为C*设计的,最好是得到它的朋友的帮助(在本例中是spark)没有针对全表扫描的本机CQL优化——它们总是不好的,因为Cassandra针对OLTP工作负载进行了优化 但是,分析(OLAP)工作负载优化由Spark完成 OLTP和OLAP是天壤之别,因此您必须使用正确的工具来完成这项工作。干杯