Data warehouse Datamart和reporting Cube有什么区别?

Data warehouse Datamart和reporting Cube有什么区别?,data-warehouse,cubes,datamart,Data Warehouse,Cubes,Datamart,这些术语到处都在使用,我不知道有什么明确的定义。我很确定我知道什么是数据集市。我还使用BusinessObjects和Cognos等工具创建了报告多维数据集 我也有人告诉我,数据集市不仅仅是一个立方体的集合 我也有人告诉我数据集市是一个报告多维数据集,仅此而已 您理解的区别是什么?对我来说,数据集市就是以相对平坦、不可用的格式转储数据的地方 多维数据集正在获取这些数据,并使之起舞。可以(也可以说应该)意味着一些非常具体的东西——OLAP工件通过诸如或Oracle(nee Hyperion)之类的

这些术语到处都在使用,我不知道有什么明确的定义。我很确定我知道什么是数据集市。我还使用BusinessObjects和Cognos等工具创建了报告多维数据集

我也有人告诉我,数据集市不仅仅是一个立方体的集合

我也有人告诉我数据集市是一个报告多维数据集,仅此而已


您理解的区别是什么?

对我来说,数据集市就是以相对平坦、不可用的格式转储数据的地方

多维数据集正在获取这些数据,并使之起舞。

可以(也可以说应该)意味着一些非常具体的东西——OLAP工件通过诸如或Oracle(nee Hyperion)之类的工具呈现。然而,它的使用也更加松散。这类OLAP多维数据集使用多维数据集感知查询工具,这些工具对标准关系数据库使用不同的API。通常OLAP服务器维护自己的优化数据结构(称为),尽管它们可以作为关系数据源的前端(称为)或以各种混合模式(称为)实现

我试图具体地使用“cube”来指代OLAP服务器(如SSA)上的多维数据集

其工作原理是通过一个或多个源(可能是关系数据库、OLAP多维数据集或平面文件)查询数据,并创建一个称为的内存中数据结构,用于支持交互式切片和骰子活动。AnalysisServices和MSQuery可以创建一个可由AS客户端软件或Excel打开并以类似方式切片和切块的数据库。IIRC最新版本的业务对象也可以打开.cub文件

作为迂腐的人,我认为业务对象位于真正的OLAP系统(如ProClarity)和即席报告工具(如、或)之间的“半结构化报告”空间中。往返查询面板使它作为一个纯思想流OLAP工具显得有些笨拙,但它确实提供了传统报告所不具备的交互性。我认为业务对象的最佳位置有两个:由不一定熟悉SQL的员工进行临时报告,以及提供以交互式格式交付的计划报告,该格式允许对数据进行深入研究

也是一个使用相当松散的术语,可以指数据仓库系统中任何面向用户的数据访问介质。定义可能包括也可能不包括报告工具和元数据层、报告层表或其他项,如多维数据集或其他分析系统

我倾向于将数据集市视为完成报告的数据库,特别是如果它是整个数据仓库体系结构中易于定义的子系统。但是,将其视为面向用户的报告层是非常合理的,特别是如果存在允许最终用户直接获取数据的特殊报告工具(如业务对象或OLAP系统)。

术语“数据集市”变得有些模糊,但传统上,它与组织信息系统中面向主题的子集相关联。数据集市并不明确表示存在OLAP等多维技术,数据集市也不明确表示存在汇总的数字数据

另一方面,多维数据集往往意味着数据是使用多维命名法(通常是OLAP技术)表示的,并且数据通常被概括为多个层次的交叉点。(即家庭净资产与个人净资产以及两者之间的一切)一般来说,“多维数据集”意味着非常具体的东西,而“数据集市”则更一般


我想在OOP语言中,你可以准确地说数据集市“有一个”立方体,“有一个”关系数据库,“有一个”漂亮的报告接口,等等……但如果说其中任何一个单独的“是”数据集市,那就不太正确了。术语数据集市更具包容性。

数据集市传统上指静态数据,通常以日期/时间为导向,供分析师用于统计、预算、绩效和销售报告以及其他规划活动


多维数据集是一个OLAP数据库,它将OLTP数据完全转换为静态的、面向日期/时间的模式,该模式使用的查询语言不是SQL,而是专门为回答数据集市类型的问题而构建的。它使用度量、维度、星型模式等术语,而不是表、列和行。最熟悉的类比可能是电子表格中的透视表。

数据集市是特定业务流程的数据集合。数据的存储方式无关紧要。多维数据集以一种特殊的多维方式存储数据,与具有行和列的表不同。olap数据库中的多维数据集类似于传统数据库的表。数据集市可以有表或多维数据集。多维数据集使分析更快,因为它提前计算聚合。

我同意Matthew的观点。我们倾向于使用术语“数据集市”来表示任何数据源,这些数据源存储通用数据和在enterprize中跨各种应用程序使用的映射。我们不在数据集市中存储可测量的数据,因此我将数据集市视为多维数据集的多个数据源之一。然而,我们就是这样做的。我相信没有什么可以阻止您在数据集市中存储可测量的数据。

顾名思义,多维数据集是一个结构化的多维数据集(通常是三维数据集,每个三维数据集代表多维数据集的三个面)。数据集市本身只是一个容器,而不是一个结构,尽管它包含以维度和事实为单位组织的数据集(如表)

多维数据集的结构使得沿着多维数据集的各个维度可视化或概念化数据变得容易。因此,大多数业务分析师或开发人员发现查询多维数据集并与之交互很容易

因为数据集市只是一个具有