Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Text 映射减少每个文本文件的实现_Text_Hadoop_Mapreduce_Hdfs_Createfile - Fatal编程技术网

Text 映射减少每个文本文件的实现

Text 映射减少每个文本文件的实现,text,hadoop,mapreduce,hdfs,createfile,Text,Hadoop,Mapreduce,Hdfs,Createfile,我需要计算每个文档中每个单词的词频,所以我想在每个文本文件中实现map reduce函数。如何在每个文本文件中实现map()和reduce() Map-Reduce中的另一个问题是 将Reduce写入输出从Reduce映射到单个文件/user/output/part-0000和project需要将每个文件处理后的输出写入不同的文本文件,如何操作?按照以下步骤操作: 在作业文件中计算输入文件的数量 将numreducers设置为等于输入文件的数量 为文件分配数字0到n-1,并将此信息传递到分布式缓

我需要计算每个文档中每个单词的词频,所以我想在每个文本文件中实现map reduce函数。如何在每个文本文件中实现map()和reduce()

Map-Reduce中的另一个问题是
将Reduce写入输出从Reduce映射到单个文件/user/output/part-0000和project需要将每个文件处理后的输出写入不同的文本文件,如何操作?

按照以下步骤操作:

  • 在作业文件中计算输入文件的数量
  • numreducers
    设置为等于输入文件的数量
  • 为文件分配数字0到n-1,并将此信息传递到分布式缓存
  • 在映射器的
    setup()
    方法中获取文件名,检索该文件的分配编号并将其分配给某个静态变量
  • Partitioner
    返回此静态变量
  • Reducer将发出“n”个文件