Hadoop 将结果存储在文本文件中
嗨,社区 我对pig完全陌生,我想将结果存储在一个文本文件中,并根据需要命名它。是否可以使用存储功能执行此操作 我的代码:Hadoop 将结果存储在文本文件中,hadoop,apache-pig,hdfs,bigdata,Hadoop,Apache Pig,Hdfs,Bigdata,嗨,社区 我对pig完全陌生,我想将结果存储在一个文本文件中,并根据需要命名它。是否可以使用存储功能执行此操作 我的代码: a = LOAD 'example.csv' USING PigStorage(';'); b = FOREACH a GENERATE $0,$1,$2,$3,$6,$7,$8,$9,$11,$12,$13,$14,$20,$24,$25; STORE b INTO ‘myoutput’; 谢谢。是的,这是可能的。b将每行存储到25个不同的列中-从$0到S25。是的
a = LOAD 'example.csv' USING PigStorage(';');
b = FOREACH a GENERATE $0,$1,$2,$3,$6,$7,$8,$9,$11,$12,$13,$14,$20,$24,$25;
STORE b INTO ‘myoutput’;
谢谢。是的,这是可能的。b将每行存储到25个不同的列中-从$0到S25。是的,您将能够将结果存储在myoutput.txt中,并且您可以使用PigStorage将数据加载到带有任何分隔符的文件中
a = LOAD 'example.csv' USING PigStorage(';');
b = FOREACH a GENERATE $0,$1,$2,$3,$6,$7,$8,$9,$11,$12,$13,$14,$20,$24,$25;
STORE b INTO ‘myoutput.txt’ using PigStorage(';');
从技术上讲,这将创建一个名为“myoutput”的目录,其中将有一个或多个部分-。。。files.LiMuBei是正确的。如果您的目标是使用可以放入内存的csv,请对其进行操作,并将结果存储为一个csv,然后使用R/Python。Hadoop等工具适用于存储在部件中的大型数据集。TLDR:不要使用蒸汽压路机如果你只需要一个熨斗,只要给做这件事的人一个提示,你应该能够运行grunt>pwd,查看输出存储在本地文件系统的什么地方。