Hadoop 列出HDFS目录中的文件
目前,我正在获取HDFS目录中的文件列表,如下所示Hadoop 列出HDFS目录中的文件,hadoop,hdfs,Hadoop,Hdfs,目前,我正在获取HDFS目录中的文件列表,如下所示 FileSystem fs = DistributedFileSystem.get( URI.create(projectDir), conf); for (FileStatus status : fs.listStatus(inputDirPath)) { //Do something } 问题是这个目录没有太多的文件。所以这会填满记忆。有没有一种方法可以让我得到一个过滤过的文件列表,比如在
FileSystem fs = DistributedFileSystem.get(
URI.create(projectDir), conf);
for (FileStatus status : fs.listStatus(inputDirPath)) {
//Do something
}
问题是这个目录没有太多的文件。所以这会填满记忆。有没有一种方法可以让我得到一个过滤过的文件列表,比如在某一天之后创建的文件