Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/clojure/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Filesystems HPC中的暂存空间/文件系统是什么_Filesystems_Nfs_Hpc_Supercomputers_Lustre - Fatal编程技术网

Filesystems HPC中的暂存空间/文件系统是什么

Filesystems HPC中的暂存空间/文件系统是什么,filesystems,nfs,hpc,supercomputers,lustre,Filesystems,Nfs,Hpc,Supercomputers,Lustre,我正在研究HPC应用程序和并行文件系统。我遇到了术语scratch space和scratch filesystem 我无法想象这个划痕空间存在于何处。它是作为挂载的文件系统/暂存器在计算节点上,还是在主存储空间上 它的内容是什么 每个计算节点上的暂存空间是独立的,或者,两个或多个节点可以共享一个暂存空间 假设我有一个123.txt文件,我想并行处理。暂存空间将包含此文件的部分还是将复制整个文件 我很困惑,谷歌上没有明确的描述。请指出一些 非常感谢 这完全取决于集群的设置方式以及用户需要什么。当

我正在研究HPC应用程序和并行文件系统。我遇到了术语scratch space和scratch filesystem

我无法想象这个划痕空间存在于何处。它是作为挂载的文件系统/暂存器在计算节点上,还是在主存储空间上

它的内容是什么

每个计算节点上的暂存空间是独立的,或者,两个或多个节点可以共享一个暂存空间

假设我有一个123.txt文件,我想并行处理。暂存空间将包含此文件的部分还是将复制整个文件

我很困惑,谷歌上没有明确的描述。请指出一些


非常感谢

这完全取决于集群的设置方式以及用户需要什么。当您被授予访问集群的权限时,您还应该获得一些关于如何使用集群的信息,这些信息应该能够回答您的大多数问题

在我使用的其中一个集群上,NFS用于长期存储,一些Lustre空间可用于作业暂存空间。所有节点都可以看到NFS和Lustre。每个节点在节点上都有一些只有该节点才能看到的临时空间

如果希望作业在123.txt上并行工作,可以将123.txt复制到共享暂存空间(Lustre),也可以将其复制到作业文件中的每个节点暂存空间

for i in `cat $PBS_NODEFILE | sort -u ` ; do scp 123.txt $i:/scratch ; done

一旦每个节点都有一个副本,就可以运行作业。工作完成后,您需要将结果复制到持久性存储,因为集群通常会运行脚本来清理临时空间

有很多不同的方法来考虑或部署临时空间或临时文件系统

假设您有一个linux节点集群,这些节点都有一个硬盘。您可以想象每个节点都有一个局部的/scratch空间。由于操作系统映像将相对较小,而且现在人们无法获得比TB驱动器更小的内存,因此节点最终将拥有接近TB的存储空间

您将如何处理此节点本地存储?哦,很多东西。可扩展的检查点重启。本地核心外业务

当我第一次开始使用集群时,将所有未使用的空间组合成一个并行文件系统似乎是个好主意。PVFS在这方面做得非常好


这让我可以切换到一个可用于所有节点的/scratch并行文件系统。这有一个技术组件(站点将部署哪个并行文件系统?),但也有一个策略组件:此文件系统上的数据将保留多长时间?有备份吗/scratch通常意味着文件没有备份,事实上在一段时间(通常两周)没有被访问后被清除。

不,我被告知要自己研究这些术语。因此。正如您所说,作业暂存空间可以作为Lustre文件系统(即基于对象的存储)使用。此暂存空间可以是磁带HDD介质等。类似地,本地暂存空间可以是磁盘驱动器或基于PCI的SSD。我的理解正确吗?我认为问题在于,正如你在谷歌搜索中发现的那样,这些术语没有很好的定义。一般的定义是,scratch文件系统/空间/分区用于单个作业或一组计算作业的短期存储,它们通常具有比常规存储更快的优势,或者提供比您通常可以访问的或两者都可以访问的更大的空间池。使用群集的人(最有可能是付费的人)将根据他们运行的应用程序确定他们是否需要快速或大的暂存空间,以及是否需要在节点之间共享。Lustre是一个全新的文件系统还是基于ext3或ext4修改的文件系统。虽然Lustre可以使用ext4或ZFS,在后端,它们是不同的技术。Ext4允许文件存储在块设备(硬盘/闪存/软盘驱动器)上,而Lustre是一个并行网络文件系统,允许客户端通过网络连接读写文件。由于读写是并行的,所以在Lustre系统中,读写是跨服务器(OST)分条(拆分)的。这将使您获得比NFS更好的性能,在NFS中,单个服务器通常是一个瓶颈??