Filesystems 如何快速填充多PB NAS?

Filesystems 如何快速填充多PB NAS?,filesystems,storage,Filesystems,Storage,我公司的产品每年将在我们的客户站点上产生数PB的数据。我想填充一个数PB的NAS来模拟一个已经运行了很长时间(3个月、6个月、一年等)的系统。我们希望在存储系统负载下运行软件时对其进行分析 我可以编写一个脚本来创建这些数据(单个脚本可能需要数周或数月才能执行)。是否有关于如何分发脚本(多台机器、多线程)的建议?NAS有3个负载平衡的传入链路。。。我应该直接在NAS设备上运行吗 是否有第三方产品可用于创建负载?我甚至不知道如何开始搜索这样的产品 数据是否真实重要吗?有人知道NAS/存储体系结构吗?

我公司的产品每年将在我们的客户站点上产生数PB的数据。我想填充一个数PB的NAS来模拟一个已经运行了很长时间(3个月、6个月、一年等)的系统。我们希望在存储系统负载下运行软件时对其进行分析

我可以编写一个脚本来创建这些数据(单个脚本可能需要数周或数月才能执行)。是否有关于如何分发脚本(多台机器、多线程)的建议?NAS有3个负载平衡的传入链路。。。我应该直接在NAS设备上运行吗

是否有第三方产品可用于创建负载?我甚至不知道如何开始搜索这样的产品

数据是否真实重要吗?有人知道NAS/存储体系结构吗?它是随机位还是数据的规律性很重要?我们以这种格式将数据散开到磁盘上

x:\<year>\<day-of-year>\<hour>\<minute>\<guid-file-name>.ext
x:\\\\\.ext

您将受到NAS/磁盘写入速度的限制-我想不出有什么办法可以绕过这一限制

因此,接下来的挑战就是,只要需要,就可以对磁盘进行饱和写入。在一台合理的机器上运行的一个脚本或一组脚本应该能够毫不费力地做到这一点

首先,使用Bonnie++之类的工具来了解磁盘的写入速度。然后,您可以使用Bonnie的代码作为饱和写入的起点—毕竟,要对磁盘进行基准测试,Bonnie必须能够比NAS更快地写入

假设您有3x1GB以太网连接,该设备的最大网络输入约为300 MB/s。一台PC能够使1GB以太网连接饱和,因此3台PC应该可以工作。让每台电脑写一段树,瞧

当然,以300MB/s的速度填充PB需要大约一个月的时间

或者,您可以在NAS状态方面对代码撒谎。在Linux上,您可以编写一个用户空间文件系统,通过为数PB的文件创建动态元数据(文件名、长度等),假装拥有数PB的数据。当产品读取时,生成随机数据。当您的产品写入时,请将其写入真实磁盘,并记住,如果再次读取,您已经获得了“真实”数据

由于您的产品在测试期间可能不会读取整个PB,也不会写入大部分PB,因此您可以轻松地立即模拟任意完整的NAS


这需要一个多月还是不到一个月的时间来开发,这是一个悬而未决的问题:)

那么您希望将数据以比NAS能够写入其磁盘更快的速度写入NAS吗?听起来似乎不合逻辑,船长。我知道NAS及其磁盘的链接速度将是最大的。很好,我想达到完全饱和。所讨论的NAS有三个独立的负载平衡传入连接。我在要求创造性地解决这个问题。不适用于尖刻的回复。您已经知道解决方案:编写一个脚本,使磁盘带宽最大化。尽可能靠近NAS运行,以获得足够的I/O带宽。如果您需要高速编写的想法,请尝试Bonnie++基准测试。根据定义,它的写入速度比磁盘快。马尔科姆!我喜欢你带这个去的地方。。。用那条评论改写你的答案,你会得到大量的选票。