Hadoop pig拉丁语-从单行输入创建多行输出

Hadoop pig拉丁语-从单行输入创建多行输出,hadoop,apache-pig,Hadoop,Apache Pig,我有如下输入数据: 第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒,759.065毫秒, 695.879毫秒 第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 619.341毫秒,725.121毫秒, 696.790毫秒 我如何将其分成多行,如下所示: 第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒 第1行20

我有如下输入数据:

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒,759.065毫秒, 695.879毫秒

第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 619.341毫秒,725.121毫秒, 696.790毫秒

我如何将其分成多行,如下所示:

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 580.372毫秒

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 759.065毫秒

第1行2014-04-04 18:46:18 | 37.52 |-84.34 | 30870 | 695.879毫秒

第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 619.341毫秒

第2行2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 725.121毫秒

第2排2014-04-04 18:47:18 | 37.68 |-84.34 | 31127 | 696.790毫秒


提前感谢

您可以使用
展平
。例如:

a = load 'test.txt' using PigStorage('|') as (c1: chararray, c2: chararray, c3: double, c4: double, c5: long, c6: chararray);
b = foreach a generate c1, c2, c3, c4, c5, STRSPLIT(c6, ', ', 3) as c6;
c = foreach b generate c1, c2, c3, c4, c5, FLATTEN(c6) as (c6: chararray, c7: chararray, c8: chararray);
dump c;