Solr Apache Cassandra中的数据聚合(分组)
我正在寻找一种优雅的解决方案,用于Cassandra数据库中的数据聚合。(问题就像在Cassandra中运行GROUPBY查询一样简单) 在我们的应用程序中,我们将客户登录历史记录存储在cassandra表中(这明显有利于更快的写入速度和更高的TPS支持),目前我们应该在这些数据之上开发一个分析仪表板。对于这一需求,数据聚合是必要的,这在Cassandra中不直接可用 我们已经评估了在Cassandra之上使用ApacheSolr的选项。两种方法:使用Solandra或使用DataStax。Solandra项目已不再处于开发阶段,无法用于生产环境。Datastax EE不是免费的(仅作为最后一个选项) 请让我们知道是否有任何更简单和优雅的解决方案,我们的问题Solr Apache Cassandra中的数据聚合(分组),solr,cassandra,cql,cassandra-2.0,datastax-enterprise,Solr,Cassandra,Cql,Cassandra 2.0,Datastax Enterprise,我正在寻找一种优雅的解决方案,用于Cassandra数据库中的数据聚合。(问题就像在Cassandra中运行GROUPBY查询一样简单) 在我们的应用程序中,我们将客户登录历史记录存储在cassandra表中(这明显有利于更快的写入速度和更高的TPS支持),目前我们应该在这些数据之上开发一个分析仪表板。对于这一需求,数据聚合是必要的,这在Cassandra中不直接可用 我们已经评估了在Cassandra之上使用ApacheSolr的选项。两种方法:使用Solandra或使用DataStax。So
提前感谢。使用Apache Spark以及DataStax Spark Cassandra连接器。如果在cassandra节点上运行Spark workers,您甚至可以获得位置感知。Spark正逐渐成为Cassandra analytics的实际负责人。感谢Ashic的快速回复。您能否进一步提供一些关于如何整合Cassandra和Spark的建议/链接。另外,如果Datastax spark是免费使用的或包含任何订阅,请告诉我。Apache spark是一个Apache项目:)Datastax spark连接器是免费的,开源的。太酷了!!因此,我可以通过集成spark和Cassandra来运行数据聚合(GROUPBY)查询,否则这是不可能的。再次感谢。是的……而且对于局部性,您可以只通过二级索引进行查询(即,不命中分区),而不必在集群范围内进行查询。这将使您能够更快地进行聚合(即不跨所有数据进行地图缩减)。如果您是一家小公司,您可能有资格免费使用DSE。datastax.com/startup