Solr Apache Cassandra中的数据聚合（分组）_Solr_Cassandra_Cql_Cassandra 2.0_Datastax Enterprise

Solr Apache Cassandra中的数据聚合（分组）

solr cassandra

Solr Apache Cassandra中的数据聚合（分组）,solr,cassandra,cql,cassandra-2.0,datastax-enterprise,Solr,Cassandra,Cql,Cassandra 2.0,Datastax Enterprise,我正在寻找一种优雅的解决方案，用于Cassandra数据库中的数据聚合。（问题就像在Cassandra中运行GROUPBY查询一样简单）在我们的应用程序中，我们将客户登录历史记录存储在cassandra表中（这明显有利于更快的写入速度和更高的TPS支持），目前我们应该在这些数据之上开发一个分析仪表板。对于这一需求，数据聚合是必要的，这在Cassandra中不直接可用我们已经评估了在Cassandra之上使用ApacheSolr的选项。两种方法：使用Solandra或使用DataStax。So

我正在寻找一种优雅的解决方案，用于Cassandra数据库中的数据聚合。（问题就像在Cassandra中运行GROUPBY查询一样简单）

在我们的应用程序中，我们将客户登录历史记录存储在cassandra表中（这明显有利于更快的写入速度和更高的TPS支持），目前我们应该在这些数据之上开发一个分析仪表板。对于这一需求，数据聚合是必要的，这在Cassandra中不直接可用

我们已经评估了在Cassandra之上使用ApacheSolr的选项。两种方法：使用Solandra或使用DataStax。Solandra项目已不再处于开发阶段，无法用于生产环境。Datastax EE不是免费的（仅作为最后一个选项）

请让我们知道是否有任何更简单和优雅的解决方案，我们的问题

提前感谢。

使用Apache Spark以及DataStax Spark Cassandra连接器。如果在cassandra节点上运行Spark workers，您甚至可以获得位置感知。Spark正逐渐成为Cassandra analytics的实际负责人。

感谢Ashic的快速回复。您能否进一步提供一些关于如何整合Cassandra和Spark的建议/链接。另外，如果Datastax spark是免费使用的或包含任何订阅，请告诉我。Apache spark是一个Apache项目：）Datastax spark连接器是免费的，开源的。太酷了！！因此，我可以通过集成spark和Cassandra来运行数据聚合（GROUPBY）查询，否则这是不可能的。再次感谢。是的……而且对于局部性，您可以只通过二级索引进行查询（即，不命中分区），而不必在集群范围内进行查询。这将使您能够更快地进行聚合（即不跨所有数据进行地图缩减）。如果您是一家小公司，您可能有资格免费使用DSE。datastax.com/startup