Java 如何从Mapreduce程序的目录中选择特定的输入文件
我正在运行一个Mapreduce程序,我的输入目录有多个文件。比方说Java 如何从Mapreduce程序的目录中选择特定的输入文件,java,hadoop,mapreduce,Java,Hadoop,Mapreduce,我正在运行一个Mapreduce程序,我的输入目录有多个文件。比方说 file1.txt file2.txt file3.txt 我只想使用file2.txt。如何在不从输入目录中删除其余文件的情况下执行此操作?您可以在代码本身中指定文件名 代码: 或者您可以在运行时执行此操作 代码: 执行: hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername 有关更多详细信息,请参阅 希望这有帮
- file1.txt
- file2.txt
- file3.txt
我只想使用file2.txt。如何在不从输入目录中删除其余文件的情况下执行此操作?您可以在代码本身中指定文件名 代码: 或者您可以在运行时执行此操作 代码: 执行:
hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername
有关更多详细信息,请参阅
希望这有帮助当前如何指定输入路径?只需将
/file2.txt
添加到该路径的末尾,或将file2*
添加到该路径中以“file2”字符串开头的所有文件path@Jedi谢谢,事实上我对Hadoop还很陌生!
FileInputFormat.addInputPath(job, new Path(args[0]));
hadoop jar Wordcount.jar Wordcount /inputfoldername/file2.txt /outputfoldername