Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从hadoop中的作业配置获取输入路径_Java_Hadoop_Hdfs - Fatal编程技术网

Java 从hadoop中的作业配置获取输入路径

Java 从hadoop中的作业配置获取输入路径,java,hadoop,hdfs,Java,Hadoop,Hdfs,我正在设置一个路径作为conf的输入位置 FileInputFormat.setInputPaths(conf, new Path("path/to/folder")); 当我试图实现自己的RecordReader时,如何从conf中检索这个位置 提前感谢…此调用设置的属性是map.input.dir,因此这应该适用于您: conf.get("map.input.dir"); 另一方面,您的记录阅读器应该根据initialize(InputSplit,TaskAttemptContext)方

我正在设置一个路径作为conf的输入位置

FileInputFormat.setInputPaths(conf, new Path("path/to/folder"));
当我试图实现自己的RecordReader时,如何从conf中检索这个位置


提前感谢…

此调用设置的属性是
map.input.dir
,因此这应该适用于您:

conf.get("map.input.dir");
另一方面,您的记录阅读器应该根据
initialize(InputSplit,TaskAttemptContext)
方法中给出的输入拆分操作,因为您在setInputPath中传递的文件夹实际上将解析为多个输入拆分,通常文件夹中的每个文件都有一个输入拆分(对于较大的可拆分文件,可能有多个输入拆分)


基于
FileInputFormat
的输入格式将
FileSplit
传递给initialize方法,您应该能够从
FileSplit.getPath()
方法中提取要处理的实际文件。

此调用设置的属性是
map.input.dir
,因此这对您来说应该是可行的:

conf.get("map.input.dir");
另一方面,您的记录阅读器应该根据
initialize(InputSplit,TaskAttemptContext)
方法中给出的输入拆分操作,因为您在setInputPath中传递的文件夹实际上将解析为多个输入拆分,通常文件夹中的每个文件都有一个输入拆分(对于较大的可拆分文件,可能有多个输入拆分)


基于
FileInputFormat
的输入格式将
FileSplit
传递给initialize方法,您应该能够从
FileSplit.getPath()
方法中提取要处理的实际文件。

要通过@ChrisWhite增加答案,它也可以位于hashkey“mapred.input.dir”下。若要通过@ChrisWhite增加答案,它也可以位于hashkey“mapred.input.dir”下。