Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/file/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
File 多个小文件作为map reduce的输入_File_Input_Hadoop_Mapreduce_Mapper - Fatal编程技术网

File 多个小文件作为map reduce的输入

File 多个小文件作为map reduce的输入,file,input,hadoop,mapreduce,mapper,File,Input,Hadoop,Mapreduce,Mapper,我有很多小文件,比如说20000多个 我想节省在映射器初始化上花费的时间,所以可以只使用500个映射器,每个映射器处理40个小文件作为输入吗 如果可能的话,我需要关于如何实现这种输入格式的指导,谢谢 顺便说一句,我知道我应该合并这些小文件,这一步也是需要的。可以使用CombineFileInputFormat。它就在电影和电影API里。这里有一个关于如何使用它的好方法

我有很多小文件,比如说20000多个

我想节省在映射器初始化上花费的时间,所以可以只使用500个映射器,每个映射器处理40个小文件作为输入吗

如果可能的话,我需要关于如何实现这种输入格式的指导,谢谢


顺便说一句,我知道我应该合并这些小文件,这一步也是需要的。

可以使用CombineFileInputFormat。它就在电影和电影API里。这里有一个关于如何使用它的好方法