Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Solr Apache Cassandra中的数据聚合(分组)_Solr_Cassandra_Cql_Cassandra 2.0_Datastax Enterprise - Fatal编程技术网

Solr Apache Cassandra中的数据聚合(分组)

Solr Apache Cassandra中的数据聚合(分组),solr,cassandra,cql,cassandra-2.0,datastax-enterprise,Solr,Cassandra,Cql,Cassandra 2.0,Datastax Enterprise,我正在寻找一种优雅的解决方案,用于Cassandra数据库中的数据聚合。(问题就像在Cassandra中运行GROUPBY查询一样简单) 在我们的应用程序中,我们将客户登录历史记录存储在cassandra表中(这明显有利于更快的写入速度和更高的TPS支持),目前我们应该在这些数据之上开发一个分析仪表板。对于这一需求,数据聚合是必要的,这在Cassandra中不直接可用 我们已经评估了在Cassandra之上使用ApacheSolr的选项。两种方法:使用Solandra或使用DataStax。So

我正在寻找一种优雅的解决方案,用于Cassandra数据库中的数据聚合。(问题就像在Cassandra中运行GROUPBY查询一样简单)

在我们的应用程序中,我们将客户登录历史记录存储在cassandra表中(这明显有利于更快的写入速度和更高的TPS支持),目前我们应该在这些数据之上开发一个分析仪表板。对于这一需求,数据聚合是必要的,这在Cassandra中不直接可用

我们已经评估了在Cassandra之上使用ApacheSolr的选项。两种方法:使用Solandra或使用DataStax。Solandra项目已不再处于开发阶段,无法用于生产环境。Datastax EE不是免费的(仅作为最后一个选项)

请让我们知道是否有任何更简单和优雅的解决方案,我们的问题


提前感谢。

使用Apache Spark以及DataStax Spark Cassandra连接器。如果在cassandra节点上运行Spark workers,您甚至可以获得位置感知。Spark正逐渐成为Cassandra analytics的实际负责人。

感谢Ashic的快速回复。您能否进一步提供一些关于如何整合Cassandra和Spark的建议/链接。另外,如果Datastax spark是免费使用的或包含任何订阅,请告诉我。Apache spark是一个Apache项目:)Datastax spark连接器是免费的,开源的。太酷了!!因此,我可以通过集成spark和Cassandra来运行数据聚合(GROUPBY)查询,否则这是不可能的。再次感谢。是的……而且对于局部性,您可以只通过二级索引进行查询(即,不命中分区),而不必在集群范围内进行查询。这将使您能够更快地进行聚合(即不跨所有数据进行地图缩减)。如果您是一家小公司,您可能有资格免费使用DSE。datastax.com/startup