Mapreduce 使用pig按日期时间列存储数据组

Mapreduce 使用pig按日期时间列存储数据组,mapreduce,apache-pig,Mapreduce,Apache Pig,假设我有这样的数据集 1, 3, 2015-03-25 11-15-13 1, 4, 2015-03-26 11-16-14 1, 4, 2015-03-25 11-16-15 1, 5, 2015-03-27 11-17-11 ... 我想按日期时间存储数据 因此,我将有以下输出文件夹 2015-03-25/ 2015-03-26/ 2015-03-27/ ... 用猪怎么做 谢谢你你可以用这个 使用FOREACH GENERATE创建一列,其中包含您感兴趣的日期部分,然后类似 STORE

假设我有这样的数据集

1, 3, 2015-03-25 11-15-13
1, 4, 2015-03-26 11-16-14
1, 4, 2015-03-25 11-16-15
1, 5, 2015-03-27 11-17-11
...
我想按日期时间存储数据

因此,我将有以下输出文件夹

2015-03-25/
2015-03-26/
2015-03-27/
...
用猪怎么做

谢谢你

你可以用这个

使用
FOREACH GENERATE
创建一列,其中包含您感兴趣的日期部分,然后类似

STORE X INTO '/my/home/output' USING MultiStorage('/my/home/output','2');