Hadoop 在Pig关系中创建类似RDBMS的序列

Hadoop 在Pig关系中创建类似RDBMS的序列,hadoop,apache-pig,Hadoop,Apache Pig,我想在pig关系上创建一个序列 例如,假设我与数据有关系: (John, A-1) (Jack, B-2) (Jim, C-1) 我想创建一个序列,即在关系中再添加一列,如 计数器,并不断增加每次读取记录的计数。示例输出应如下所示: (如果200是开始顺序。) 我应该如何继续进行此操作?我不确定您是否可以在map/reduce中实际执行此操作,因为没有保存和同步此序列的全局位置-不同的map实例都在单独的服务器上运行,您无法同步它们(无论如何都不会带来很大的痛苦)我不确定您是否可以在map/r

我想在pig关系上创建一个序列

例如,假设我与数据有关系:

(John, A-1)
(Jack, B-2)
(Jim, C-1)
我想创建一个序列,即在关系中再添加一列,如 计数器,并不断增加每次读取记录的计数。示例输出应如下所示:

(如果200是开始顺序。)


我应该如何继续进行此操作?

我不确定您是否可以在map/reduce中实际执行此操作,因为没有保存和同步此序列的全局位置-不同的map实例都在单独的服务器上运行,您无法同步它们(无论如何都不会带来很大的痛苦)

我不确定您是否可以在map/reduce中真正做到这一点,因为没有保存和同步此序列的全局位置-不同的map实例都在单独的服务器上运行,您无法同步它们(无论如何都不会带来很大的痛苦)

(John, A-1, 201)
(Jack, B-2, 202)
(Jim, C-1, 203)