hadoop位于linux文件系统之上,不会受到磁盘搜索的影响吗?

hadoop位于linux文件系统之上,不会受到磁盘搜索的影响吗?,hadoop,hdfs,Hadoop,Hdfs,我是Hadoop的新手,我知道HDFS是每个块64 mb(分钟),并且可以根据系统的不同而增加。但由于hdfs安装在每个块4kb的linux文件系统之上,hadoop不会遭受磁盘搜索吗?hdfs是否也与linux文件系统交互?您的想法在一定程度上是正确的,但从更大的角度来看。当这个64MB存储在Linux文件系统上时,它分布在许多节点上。因此,如果您想要读取存储在3个不同Linux文件系统(机器)上的3个块(每个4KB),由于读取是并行的,因此搜索将仅用于1次搜索,而不是3次搜索 我认为这可能有

我是Hadoop的新手,我知道HDFS是每个块64 mb(分钟),并且可以根据系统的不同而增加。但由于hdfs安装在每个块4kb的linux文件系统之上,hadoop不会遭受磁盘搜索吗?hdfs是否也与linux文件系统交互?

您的想法在一定程度上是正确的,但从更大的角度来看。当这个64MB存储在Linux文件系统上时,它分布在许多节点上。因此,如果您想要读取存储在3个不同Linux文件系统(机器)上的3个块(每个4KB),由于读取是并行的,因此搜索将仅用于1次搜索,而不是3次搜索

我认为这可能有帮助:

之所以是4k,是因为页面错误机制,因为页面是4k大的。你认为这是为什么?像64m这样的大数据块的原因是,您可以从磁盘顺序读取它们,而不必四处搜索。我知道linux有4kb数据块的原因。我的问题是,由于hadoop安装在Linux之上,并且hadoop的每个数据块为64mb,所以当hadoop的数据存储在磁盘上时,它会通过Linux文件系统吗。