Sql server 数据仓库-什么是好的定义?

Sql server 数据仓库-什么是好的定义?,sql-server,data-warehouse,Sql Server,Data Warehouse,有人能给我一个关于数据仓库是什么的好的、实用的定义吗?一个为检索而优化的数据库,通常是非规范化数据,通常是星型模式(但可能是雪花型的),并使用维度建模(事实和维度表)我刚开始学习数据仓库和商业智能,环顾网络,你可以找到一些有趣的链接: 我认为这两个链接可以帮助您理解数据仓库的概念 对不起,我是新的,我只能发布一个链接^^ 很抱歉,作为垃圾邮件预防机制,新用户最多只能发布一个超链接。获得10个声誉以发布更多超链接。我很惊讶没有人发布: 仓库是以主题为导向的, 集成、时变和 数据的非易失性收集

有人能给我一个关于数据仓库是什么的好的、实用的定义吗?

一个为检索而优化的数据库,通常是非规范化数据,通常是星型模式(但可能是雪花型的),并使用维度建模(事实和维度表)

我刚开始学习数据仓库和商业智能,环顾网络,你可以找到一些有趣的链接:

我认为这两个链接可以帮助您理解数据仓库的概念

对不起,我是新的,我只能发布一个链接^^


很抱歉,作为垃圾邮件预防机制,新用户最多只能发布一个超链接。获得10个声誉以发布更多超链接。

我很惊讶没有人发布:

仓库是以主题为导向的, 集成、时变和 数据的非易失性收集 支持管理层的决策 制作过程

从同一页中,您可以了解Kimball的定义:

事务数据的副本 专门针对查询和 分析

不幸的是,我认为数据仓库是一个广泛的领域。有很多种类,只有很少的标准范例,特别是我想到了Kimball的维度建模。Inmon没有Kimball那样具体的方法论,因此一些3NF模型可能符合也可能不符合他的原则

因为Inmon拓宽了仓储的范围,所以它可以包含非结构化数据。然而,非结构化数据的分析与传统分析有很大的不同

正如应用于SQL Server一样,SQL Server上最大的数据仓库通常是按维度建模的,因为这非常适合于非分布式、非大规模并行模型。像Teradata这样的大规模并行系统通常在使用3NF模型时表现更好。这些仍然是基于表的系统,各种表通过外键约束连接(可能并没有强制执行,但至少是逻辑的)


当然,我们也看到了像Map/Reduce这样的NoSQL数据处理系统,它们根本不是我们已经拥有了40年的规范化、非规范化或非/不规范化关系数据库意义上的数据库。

虽然这不是一个学术定义,但它可能是一个实用的定义。数据仓库是数据集市的集合,将在整个组织范围内合并数据集

数据集市将包含特定于业务某些部分的数据集。在数据集市中,您将发现事实表、可测量的信息片段以及可测量片段的维度和属性

真正的数据仓库将具有一致的维度表,这些维度表可以跨数据集市共享

一个例子

您的公司可能会围绕销售建立数据集市。和另一个关于人力资源的数据集市。如果客户维度表在这两个数据集市之间共享,则它将被视为符合条件的维度。这三个实体一起构成了一个数据仓库


正如其他人所说,您可以通过搜索Ralph Kimball的数据策略来找到更详细的信息。

定义:数据仓库是用于分析目的而不是用于事务处理的数据库

有关数据仓库的更多信息,请查看下面的链接


你应该在这里写下这篇文章的重要部分,至少因为链接可能会断开,现在看起来更像是一条评论,而不是答案。