Hadoop HDFS文件分割位置

Hadoop HDFS文件分割位置,hadoop,hdfs,yarn,filesplitting,Hadoop,Hdfs,Yarn,Filesplitting,我有一个安装了hadoop-2.1.0-beta的集群。有没有办法了解每个filesplit在集群中的位置?我要找的是下面这样的列表 filesplit_0001 node1 filesplit_0002 node4 ... 编辑:我知道这样的列表在Microsoft Azure中可用。fsck工具提供了一种简单的方法,可以找出任何特定文件中的块。例如: % hadoop fsck <path> -files -blocks -locations -racks 谢谢@mgs,如果

我有一个安装了hadoop-2.1.0-beta的集群。有没有办法了解每个filesplit在集群中的位置?我要找的是下面这样的列表

filesplit_0001 node1
filesplit_0002 node4
...
编辑:我知道这样的列表在Microsoft Azure中可用。

fsck工具提供了一种简单的方法,可以找出任何特定文件中的块。例如:

% hadoop fsck <path> -files -blocks -locations -racks

谢谢@mgs,如果块大小等于文件碎片大小,这是一个很好的答案。但在我的例子中,这两个有不同的尺寸。
InputSplit inputSplit=context.getInputSplit(); //Input split instance 
String[] splitLocations = inputSplit.getLocations();