Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何将我的hadoop结果重命名为一个带有“0”的文件;。csv";延伸_Csv_Hadoop_Mapreduce - Fatal编程技术网

如何将我的hadoop结果重命名为一个带有“0”的文件;。csv";延伸

如何将我的hadoop结果重命名为一个带有“0”的文件;。csv";延伸,csv,hadoop,mapreduce,Csv,Hadoop,Mapreduce,实际上,我的意图是将hadoop作业的输出重命名为.csv文件,因为我需要在rapidminer中可视化此csv数据 据说,为此,我需要遵循以下三个步骤: 1. Submit the MapReduce Job 2. Which will extract the output from HDFS using shell commands 3. Merge them together, rename as ".csv" and place in a directory

实际上,我的意图是将hadoop作业的输出重命名为
.csv
文件,因为我需要在rapidminer中可视化此csv数据

据说,为此,我需要遵循以下三个步骤:

    1. Submit the MapReduce Job 
    2. Which will extract the output from HDFS using shell commands 
    3. Merge them together, rename as ".csv" and place in a directory where the visualization tool can access the final file
如果是,我怎样才能做到这一点

更新
myjob.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit

cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
显示:

The CSV file was empty and couldn’t be imported. 
当我试图打开
output.csv

解决方案

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv

首先,您需要从HDFS检索MapReduce结果

hadoop dfs -copyToLocal path_to_result/part-r-* local_path
然后将它们放在一个文件中

cat local_path/part-r-* > result.csv

然后它取决于您的MapReduce结果格式,如果它已经是csv格式,那么就完成了。如果没有,您可能必须使用其他工具(如sed或awk)将其转换为csv格式。

首先,您需要从HDFS检索MapReduce结果

hadoop dfs -copyToLocal path_to_result/part-r-* local_path
然后将它们放在一个文件中

cat local_path/part-r-* > result.csv

然后它取决于您的MapReduce结果格式,如果它已经是csv格式,那么就完成了。如果没有,您可能必须使用其他工具(如sed或awk)将其转换为csv格式。

一切正常,但当我在localfs中查看.csv文件时,该文件为空。我也在共享我的shell脚本。但是没有显示任何错误。在本地部分中-r-00000包含文本。您需要添加“>”,这是输出重定向,就像上面在我的回答中的cat命令一样。一切正常,但当我在localfs中查看我的.csv文件时,该文件为空。我也在共享我的shell脚本。但是没有显示错误。在本地部分中,r-00000包含文本。您需要添加“>”,这是输出重定向,就像上面我的答案中的cat命令一样