Warehouse 哪个是最好的免费数据仓库产品

Warehouse 哪个是最好的免费数据仓库产品,warehouse,Warehouse,我正在开发一个包含大量olap工作的系统。根据我的研究,基于列的数据仓库是最好的选择。但我对选择一个好的数据仓库产品感到困惑 我看到的所有关于数据仓库比较的文章都是2012年之前的,关于它的文章似乎很少。数据仓库过时了吗?Hadoop HBase更好 据我所知,InfiniDB是一种高性能的开源数据仓库产品,但它已经有2年没有维护了。关于InfiniDB的文献也很少。InfiniDB是否被开发人员大量使用 到目前为止,哪种数据仓库产品是最好的 如何以增量方式将存储在Mysql数据库中的业务数据移

我正在开发一个包含大量olap工作的系统。根据我的研究,基于列的数据仓库是最好的选择。但我对选择一个好的数据仓库产品感到困惑

  • 我看到的所有关于数据仓库比较的文章都是2012年之前的,关于它的文章似乎很少。数据仓库过时了吗?Hadoop HBase更好

  • 据我所知,InfiniDB是一种高性能的开源数据仓库产品,但它已经有2年没有维护了。关于InfiniDB的文献也很少。InfiniDB是否被开发人员大量使用

  • 到目前为止,哪种数据仓库产品是最好的

  • 如何以增量方式将存储在Mysql数据库中的业务数据移动到数据仓库

  • 谢谢你的回答

  • 数据仓库仍然是一个热门话题,HBase不是fastes,而是一个非常知名且兼容的话题(许多应用程序都是基于它构建的)

  • 几年前,我开始了一个很好的专栏存储的旅程,最终选择了InfiniDB,因为它可以轻松地从纯mysql迁移。这是一个很好的软件,但它仍然有缺陷,所以我不能完全推荐它在生产中使用。(如果没有第二个故障切换实例,则不能)。 然而,MariaDB已经获取了InfiniDB技术,并将其移植到他们的MariaDB数据库服务器上。这个名为MariaDB Columnstore[1]的新产品作者提供了一个测试构建。他们已经投入了大量的精力,所以我认为ColumnStore将在未来两年内获得MariaDB的主要产品

  • 我不能回答这个问题。我仍然在InfiniDB工作,也在帮助其他人完成他们的项目

  • 这完全取决于您的数据结构和使用情况。

  • InfiniDB非常擅长查询,它(在我的测试中)的性能比impala高出约8%,然而,尽管InfiniDB支持插入、更新、删除和事务,但它在事务工作负载方面并不出色。i、 e.仅仅将一个社区驱动的网站迁移到infinidb,在这里,访问者总是操纵数据,这是行不通的。一个10000行的插入将很好地工作,10000个1行的插入将杀死它

    我们为客户部署了Infinidb,以“帮助”常规mariadb安装的查询性能—我们创建了一个工具,将mariadb数据库表导入并更新到Infinidb中,从而加快查询速度。该表上的操作仍在MairaDB中完成,更改将以30秒的延迟批量导入InfiniDB。由于原始表和infinidb表具有相同的结构,并且可以通过api mysql访问,因此我们只需切换数据库连接并进行超快速的选择查询。这在我们的用例中非常有效

    我们还从头构建了新的统计/分析应用程序,与infinidb一起使用,并取代了旧的基于MySQL的系统,该系统运行良好,性能高于任何预期。(我们现在拥有的数据是mariadb中的15倍,而且维护起来更容易,查询起来也更快)


    [1]

    我想尝试一下拼接机(开源)。它将数据存储在HBase上,并将提供仓库提供的核心数据管理功能(主键、约束、外键等)

    询问技术建议的问题对于堆栈溢出来说是无关紧要的,因为它们往往会生成基于意见的答案。如果你有一个具体的问题,你最好描述一下,这样你可能会得到一些帮助。非常感谢你的回答。我们的产品仍然基于mysql。根据您的描述,您的意思是MariaDB columnstore与mysql很好地兼容,并且是mysql的良好数据恶意软件选择吗?昨天,有人向我推荐了基于HBase的Kylin,你试过了吗?你能给我一些建议吗?