Db2 什么';备份大型实时数据仓库的最佳方法是什么?

Db2 什么';备份大型实时数据仓库的最佳方法是什么?,db2,Db2,我有一个DB2ESE9.7非dpf数据仓库,它使用20TB的数据压缩,每天通过每10分钟的加载获得1亿行数据,通过每天50000次导入获得另外100万行数据。此外,还有少量事务数据与其他两大数据集相关联 目前,我们正在使用应用程序级备份,并且依赖于加载以前导出的摘要表,或者在恢复时每天重新加载1亿行。但是为了少量的事务和导入,我想要在线备份 但是,特定于表空间的联机备份似乎需要初始脱机备份。这就是问题所在,即使我可以将脱机备份重定向到/dev/null,脱机备份也需要大约48小时的停机时间。这是

我有一个DB2ESE9.7非dpf数据仓库,它使用20TB的数据压缩,每天通过每10分钟的加载获得1亿行数据,通过每天50000次导入获得另外100万行数据。此外,还有少量事务数据与其他两大数据集相关联

目前,我们正在使用应用程序级备份,并且依赖于加载以前导出的摘要表,或者在恢复时每天重新加载1亿行。但是为了少量的事务和导入,我想要在线备份

但是,特定于表空间的联机备份似乎需要初始脱机备份。这就是问题所在,即使我可以将脱机备份重定向到/dev/null,脱机备份也需要大约48小时的停机时间。这是不能接受的。在将来的某个时候可能会再次需要

在某个时候,我们可能会将其拆分为8+个分区,这将有助于此和加载索引构建。但这可能在一段时间内不会发生,而且很难证明一开始就不必要的任务是合理的

编辑:我们最初没有使用DPF的原因,以及为什么它不是我们查询的驱动问题,是因为超过99%的查询命中摘要表,而每月有30多亿行的表中有1%的查询几乎总能利用表分区,MDC和索引,以便只扫描更小的量。这意味着,关于每个CPU有多少数据的传统启发式方法并不总是适用


有没有办法绕过离线备份要求?有第三方工具可以帮我吗?还有其他建议吗?

不幸的是,没有办法解决这个问题——在进行数据库的物理设计时,您必须为恢复做好计划。通过使用带范围分区的单独表空间,您可以仅备份具有新数据的表空间(假设您知道哪些表空间正在更改…)

通常,这属于在磁盘级别使用拆分镜像或快照的范围。当然,这需要您的磁盘子系统支持此功能(除非您使用的是Veritas Volume Manager之类的软件),并且您有能力实际启用此功能。不过,DB2完全支持这一点,而且非常有用。我已经通过EMC Symmetrix和Clariion做到了这一点;但它确实需要一个短暂的“中断”,即冻结数据库I/O,以便发出操作系统命令来处理断开镜像的问题


在v9.5中,DB2添加了一个名为Advanced Copy Services(ACS)的特性,它允许存储供应商集成到备份数据库命令中。IBM的一些存储子系统支持这一点,NetApp也很快增加了对这一点的支持。说“备份数据库HUGEDB使用快照”并用10秒钟观看它,这是非常令人惊讶的。然后“恢复数据库HUGEDB使用在时间戳上拍摄的快照”。

谢谢。多年来,我们基于重新加载文件的备份/恢复策略一直运行得非常好,我们非常希望保留它。但我从BCU 2.1概述文档中得到的印象是,我们现在可以执行表空间备份,而无需基于完整的数据库备份。这是我更喜欢的场景,因为它不需要新的存储硬件,而且新添加的事务表空间小于数据库其余部分的0.1%。不过我会记住ACS——我正在考虑2011年的硬件更新。您可以在没有完整数据库备份的情况下进行表空间备份(并且您可以从单个表空间备份中恢复数据库);但是,如果没有脱机备份,则无法启用归档日志记录。归档日志记录是表空间备份的先决条件。对于记录,Symmetrix支持使用-consistent标志安全地创建跨多个LUN的数据库克隆和快照。这将允许数据库保持在线并在不停机的情况下进行处理。快照操作是即时的,只存储差异,因此每次备份不需要整个数据库的磁盘空间。我相信Symmetrix在单个设备上可以有126个快照会话(使用多虚拟快照),但我可能在这一点上错了。您可以在文档中找到确切的数字。@tster:您仍然需要冻结数据库IO,以便数据库本身保持一致。我在不冻结数据库的情况下进行了快照,这些快照通常都能正常工作。然而,为了保证可恢复性,最好的做法是冻结数据库I/O。在我为EMC工作时,我没有直接研究该功能,但我做了一个测试,针对Oracle数据库进行了一致性克隆(或者可能是镜像),我从未见过失败。也许只有一些数据库支持它。我真的不会感到惊讶。我想看一看db2的特性-