Hadoop pig拉丁语-从单行输入创建多行输出_Hadoop_Apache Pig

Hadoop pig拉丁语-从单行输入创建多行输出

hadoop apache-pig

Hadoop pig拉丁语-从单行输入创建多行输出,hadoop,apache-pig,Hadoop,Apache Pig,我有如下输入数据：第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒，759.065毫秒， 695.879毫秒第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 619.341毫秒，725.121毫秒， 696.790毫秒我如何将其分成多行，如下所示：第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒第1行20

我有如下输入数据：

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒，759.065毫秒， 695.879毫秒

第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 619.341毫秒，725.121毫秒， 696.790毫秒

我如何将其分成多行，如下所示：

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 759.065毫秒

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 695.879毫秒

第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 619.341毫秒

第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 725.121毫秒

第2排2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 696.790毫秒

提前感谢

您可以使用

展平

。例如：

a = load 'test.txt' using PigStorage('|') as (c1: chararray, c2: chararray, c3: double, c4: double, c5: long, c6: chararray);
b = foreach a generate c1, c2, c3, c4, c5, STRSPLIT(c6, ', ', 3) as c6;
c = foreach b generate c1, c2, c3, c4, c5, FLATTEN(c6) as (c6: chararray, c7: chararray, c8: chararray);
dump c;