如何将多个文件作为输入传递到MapReduce？_Mapreduce

如何将多个文件作为输入传递到MapReduce？

mapreduce

如何将多个文件作为输入传递到MapReduce？,mapreduce,Mapreduce,我想使用两个文件作为MapReduce程序的输入。但是使用*不能作为文件名模式。我希望使用input/就可以了。要开始，请尝试运行Wordcount示例：在本教程的最后，他们将向您解释如何运行作业（他们在位于输入映射中的多个字典文件上运行作业）编辑：还可以查看本教程，了解如何使用分布式文件系统，您通常需要在dfs中输入文件。它可以工作，并且应该也可以在您的计算机上工作。你确定你要走的路吗？它是input/190*.txt还是/input/190*.txt。请注意“/”。假定不带/的路径存在于

我想使用两个文件作为MapReduce程序的输入。但是使用*不能作为文件名模式。

我希望使用input/就可以了。要开始，请尝试运行Wordcount示例：

在本教程的最后，他们将向您解释如何运行作业（他们在位于输入映射中的多个字典文件上运行作业）

编辑：还可以查看本教程，了解如何使用分布式文件系统，您通常需要在dfs中输入文件。

它可以工作，并且应该也可以在您的计算机上工作。你确定你要走的路吗？它是input/190*.txt还是/input/190*.txt。请注意“/”。假定不带/的路径存在于/user中，其中带/的as路径直接存在于根目录下

它还可以与mv（或任何其他HDFS命令）一起使用。

是。input/将读取输入目录下的所有文件。但是，如果它也包含其他不相关的文件呢？在这种情况下，使用文件模式是唯一的选择。不，它不适合我。我的输入参数是

input/190*.txt

，因为

input

目录在当前工作目录中。这是我执行其他无模式命令的常用方式。文件存储在路径

/user/myname/input

中。因此，我使用的路径是

input/190*.txt