使用SSAS分析IIS日志

使用SSAS分析IIS日志,iis,aggregate,logging,ssas,cube,Iis,Aggregate,Logging,Ssas,Cube,我希望聚合我们的IIS日志,并能够快速对其执行简单查询(例如,在过去一个月中,第x页命中了多少次等) 我想将这些数据聚合到一个SSAS多维数据集中(时间维度上的粒度可能降低到10分钟左右) 我们已经通过SSIS将日志导入到表中。这些表变得非常大,我想开始删除较旧的数据(比如3个多月前),同时将历史记录保存在多维数据集中(这样我仍然可以查询超过3个月的数据)。这是一个合理的事情做-显然,我不能很容易地重建我的立方体,如果我想改变它。。。我想我需要像备份数据库一样备份多维数据集 目前我在数据上没有P

我希望聚合我们的IIS日志,并能够快速对其执行简单查询(例如,在过去一个月中,第x页命中了多少次等)

我想将这些数据聚合到一个SSAS多维数据集中(时间维度上的粒度可能降低到10分钟左右)

我们已经通过SSIS将日志导入到表中。这些表变得非常大,我想开始删除较旧的数据(比如3个多月前),同时将历史记录保存在多维数据集中(这样我仍然可以查询超过3个月的数据)。这是一个合理的事情做-显然,我不能很容易地重建我的立方体,如果我想改变它。。。我想我需要像备份数据库一样备份多维数据集

目前我在数据上没有PK-添加一个标识列或创建一个过期、时间和url的复合PK会更好吗

成功实现此功能的人的任何反馈都将非常棒:)


谢谢

我还没有完全做到这一点,但我会尽可能多地给你一些意见:

表变得越来越大,为什么这是一个问题?是存储空间还是速度

如果是速度,考虑使用表分区来分割大表。您可以按日期范围对它们进行分区,然后将分区切换到另一个表中(减小原始表的大小),这是一个纯元数据操作,并且是即时的。然后,SSAS可以使用一个视图,该视图在处理时合并两个表,如果您需要重建,也可以

如果是存储空间,您是否查看过SQL Server中的压缩(2008年提供,不确定您使用的是哪个版本?)

就我个人而言,如果没有重建多维数据集的能力,我会很不高兴。还要记住,多维数据集会复制源数据(或者更确切地说,它根据DSV使用的部分),因此,如果删除旧数据并将多维数据集视为“存储设备”,您可能不会像您想象的那样保存数据。您的多维数据集是否只使用部分表?它与基础数据相比有多大

SSA并不严格要求对数据进行PK—但是—我总是使用它们,主要是为了防止重复加载(我也按时间加载—检查数据是否比上次加载的数据新),但最好有PK约束来防止重复加载

对于你的PK,日期,时间,URL听起来不错,但取决于你的网站有多忙。您的示例不允许两个人同时查看同一个URL。你能给PK添加IP地址吗?如果一个访问者很快就恢复了精神呢?您是否可以将其视为副本,并将其从SSIS数据流中删除


祝你好运,如果你对我说的话有任何问题,请告诉我。

谢谢你的评论!我将进一步调查并更新此问题。