Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cassandra/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Mongodb 哪种NoSQL技术可以取代MOLAP多维数据集进行即时查询?_Mongodb_Cassandra_Olap_Hbasestorage_Nosql - Fatal编程技术网

Mongodb 哪种NoSQL技术可以取代MOLAP多维数据集进行即时查询?

Mongodb 哪种NoSQL技术可以取代MOLAP多维数据集进行即时查询?,mongodb,cassandra,olap,hbasestorage,nosql,Mongodb,Cassandra,Olap,Hbasestorage,Nosql,我想知道您是否可以告诉我在我的场景中应该使用哪些NoSQL db或技术/工具。我们正在考虑用开源技术取代基于SQL server Analysis services的OLAP多维数据集,因为数据量太大,无法管理,查询返回时间太长。我们遵循了书中的每一条规则来分割数据,通过使用聚合和分区等优化多维数据集的设计,而且我们的一些不同计数查询需要1-2分钟:(事实表的数据大小大约为250GB。并且有10-12个维度以星型模式连接 因此,我们决定让Hadoop/HBase/NoSQL dbs等开源技术尝试

我想知道您是否可以告诉我在我的场景中应该使用哪些NoSQL db或技术/工具。我们正在考虑用开源技术取代基于SQL server Analysis services的OLAP多维数据集,因为数据量太大,无法管理,查询返回时间太长。我们遵循了书中的每一条规则来分割数据,通过使用聚合和分区等优化多维数据集的设计,而且我们的一些不同计数查询需要1-2分钟:(事实表的数据大小大约为250GB。并且有10-12个维度以星型模式连接

因此,我们决定让Hadoop/HBase/NoSQL dbs等开源技术尝试一下,看看它们是否能够以最少的设置和安装来解决我们的OLAP场景

我们对新技术的主要要求是

  • 它必须为不同的计数查询(小于2秒)获得快速或即时的结果

  • 支持度量和维度的概念(如OLAP)

  • 支持类似SQL的查询语言,因为我们的许多开发人员都是SQL专家
  • 能够连接Excel/Tableau以可视化数据

  • 今天,开源世界有这么多新技术和工具,我希望你能帮我指出正确的方向。

    看起来“Kylin”是我的答案。这满足了我想要的所有要求,甚至更多。我现在要试试看!:)

    注意:我来自ApacheKylin团队

    请参考以下答案,这些答案可能会给您带来一些想法:

    我们对新技术的主要要求是 它必须为不同的计数查询(小于2秒)获得快速或即时的结果


    --卢克:我们目前的统计数据是90%的查询延迟小于5秒。因为我远不是一个非sql技术专家,但据我所知,非sql数据库的意义不在于分析数据,而在于方便地存储和检索数据。分析这些数据需要数据处理引擎,如ApacheSpark。大数据处理实际上更像是一个连续不断的长批量处理(从几分钟到几小时),而不是快速查询的实时分析。关于不同计数查询的纯性能,假设可以选择250 gb的ram,MongoDB可以用作纯内存数据库。@GaelFG还有一些专注于数据分析的NoSQL技术,如Hadoop+HBase或Neo4j。这就是术语NoSQL的问题:这是一个如此广泛的领域,任何概括都是严重的过度简化。一般来说,关于NoSQL,您只能说“不使用SQL存储数据的技术”。mongodb支持SQL查询吗?是否有像tableau这样的可视化工具可以连接到mongodb实例或集群开箱即用,而不需要像编写驱动程序那样编写大量代码?如果我们没有250GB的机器怎么办?它是否支持允许跨多个维度进行切片和数据的维度和度量的概念?感谢您的评论。关于麒麟,我没有更多的问题。请随时与我联系。谢谢,我的目标差不多。不过,我一直在使用PPS和Power Bi报告。PPS与其他操作和olap措施(mdx)紧密结合。是否有可能对kylin进行额外的操作和计算?同时,我想向我的客户提出这个建议。他们的企业解决方案是否涉及许可成本?