Mysql BI架构建议

Mysql BI架构建议,mysql,data-warehouse,business-intelligence,talend,Mysql,Data Warehouse,Business Intelligence,Talend,我想得到一些关于我们的BI体系结构的建议,它的维护相当复杂 我在一家电子购物公司工作,我们的产品在LAMP系统(Linux Apache MySQL PHP)上工作 每晚: 使用Talend提取来自prod DB(MySQL)的数据,然后将其插入另一个名为DWH的MySQL数据库,用于数据仓库 然后Jedox/Palo从这个DWH中提取数据以加载OLAP多维数据集,Excel使用这些多维数据集和插件进行恢复 此DWH中的数据也可以通过Access/Excel一次性报告进行访问,但这不是很好

我想得到一些关于我们的BI体系结构的建议,它的维护相当复杂

我在一家电子购物公司工作,我们的产品在LAMP系统(Linux Apache MySQL PHP)上工作

每晚:

  • 使用Talend提取来自prod DB(MySQL)的数据,然后将其插入另一个名为DWH的MySQL数据库,用于数据仓库
  • 然后Jedox/Palo从这个DWH中提取数据以加载OLAP多维数据集,Excel使用这些多维数据集和插件进行恢复
  • 此DWH中的数据也可以通过Access/Excel一次性报告进行访问,但这不是很好
每次我们需要修改现有的工作流或创建新的报告时,都需要使用许多步骤和不同的技术,这将导致我们进入一个相当复杂的平台


我能做些什么来简化这个过程呢?

对做什么或不做什么给出建议有点困难,这取决于你的最终目标。我建议您在交付OLAP多维数据集之前将数据分为几个阶段

例如,您可以在现有的DW数据库中创建事实和维度,这样您就可以将数据分为多个主题,这将使您的报告构建更加容易,因为任何人都可以根据需要对这些数据进行分组。你可以有一个只用于销售的事实表,另一个用于客户流失,另一个用于新客户,然后继续

试着看一看事实和维度表,或者仅仅是维度建模,这将使你的日常工作变得更加容易

一些链接:

您应该能够使用提供的Palo组件,使用Talend加载Palo OLAP表,作为数据仓库加载过程的一部分,这样可以减少在主ETL过程中以单独的方式进行ETL工作

罗伯托·马切托(Roberto Machetto)的博客中有一些关于如何做到这一点的内容,我相信互联网上还有更多的例子,当然你可以在这里询问你遇到的任何具体问题


一旦您的所有数据都正确加载到数据仓库和任何OLAP多维数据集中,那么您的用户应该能够在存储数据时对数据运行任何定制或其他查询。如果您看到用户无法访问适当数据进行分析的情况,则应通过正确理解维度建模,在初始数据仓库/OLAP多维数据集加载中解决此问题。

问题是什么?嗯,对不起:),我们如何获得更轻、更高效的体系结构?