如何将多个文件作为输入传递到MapReduce?

如何将多个文件作为输入传递到MapReduce?,mapreduce,Mapreduce,我想使用两个文件作为MapReduce程序的输入。但是使用*不能作为文件名模式。我希望使用input/就可以了。要开始,请尝试运行Wordcount示例: 在本教程的最后,他们将向您解释如何运行作业(他们在位于输入映射中的多个字典文件上运行作业) 编辑:还可以查看本教程,了解如何使用分布式文件系统,您通常需要在dfs中输入文件。它可以工作,并且应该也可以在您的计算机上工作。你确定你要走的路吗?它是input/190*.txt还是/input/190*.txt。请注意“/”。假定不带/的路径存在于

我想使用两个文件作为MapReduce程序的输入。但是使用*不能作为文件名模式。

我希望使用input/就可以了。要开始,请尝试运行Wordcount示例:

在本教程的最后,他们将向您解释如何运行作业(他们在位于输入映射中的多个字典文件上运行作业)


编辑:还可以查看本教程,了解如何使用分布式文件系统,您通常需要在dfs中输入文件。

它可以工作,并且应该也可以在您的计算机上工作。你确定你要走的路吗?它是input/190*.txt还是/input/190*.txt。请注意“/”。假定不带/的路径存在于/user中,其中带/的as路径直接存在于根目录下


它还可以与mv(或任何其他HDFS命令)一起使用。

是。input/将读取输入目录下的所有文件。但是,如果它也包含其他不相关的文件呢?在这种情况下,使用文件模式是唯一的选择。不,它不适合我。我的输入参数是
input/190*.txt
,因为
input
目录在当前工作目录中。这是我执行其他无模式命令的常用方式。文件存储在路径
/user/myname/input
中。因此,我使用的路径是
input/190*.txt