Hadoop-管理多个输入/输出文件
我在管理多个输入文件时遇到问题 我在Hadoop-管理多个输入/输出文件,hadoop,mapreduce,Hadoop,Mapreduce,我在管理多个输入文件时遇到问题 我在../input/文件夹中有许多文件,我希望为每个输入文件执行一个mapreduce作业,以便每个输入文件都有自己的输出(在../output/中) 现在,我试着在网上搜索,但是很多页面都很旧,我找不到一个有效的方法。我可以使用哪些方法/类来实现这一点 提前感谢。您需要指定一个输入文件而不是目录,并且每个MR作业都需要指定一个输出目录哦,有那么简单吗?
../input/
文件夹中有许多文件,我希望为每个输入文件执行一个mapreduce作业,以便每个输入文件都有自己的输出(在../output/
中)
现在,我试着在网上搜索,但是很多页面都很旧,我找不到一个有效的方法。我可以使用哪些方法/类来实现这一点
提前感谢。您需要指定一个输入文件而不是目录,并且每个MR作业都需要指定一个输出目录哦,有那么简单吗?