Apache pig 如何从pig中的单个元组创建多个元组?

Apache pig 如何从pig中的单个元组创建多个元组?,apache-pig,Apache Pig,我在pig中有类似“5060-5070”的列,我想编写一个udf来返回元组,如下所示: col1和col2在所有元组中都是相同的 col1,col25060 col1,col25061 col1,col25062 或者如果有任何替代方法(而不是使用udf)从单个元组创建多个元组。您应该创建一个返回数据包的udf。数据包可以包含任意数量的元组。然后使用“展平”扩展此数据包。使用BagFactory创建数据包,使用TupleFactory创建一个元组并将其添加到其中。UDF是您唯一的选择,您能帮我写

我在pig中有类似“5060-5070”的列,我想编写一个udf来返回元组,如下所示:

col1和col2在所有元组中都是相同的

col1,col25060

col1,col25061

col1,col25062


或者如果有任何替代方法(而不是使用udf)从单个元组创建多个元组。

您应该创建一个返回数据包的udf。数据包可以包含任意数量的元组。然后使用“展平”扩展此数据包。使用BagFactory创建数据包,使用TupleFactory创建一个元组并将其添加到其中。

UDF是您唯一的选择,您能帮我写一下吗。检查此链接作为编写UDF的开始。好的..但我想对列进行一些处理。如何使用udf中的列??任何udf都会收到一个它可以处理的元组。例如,如果您像foreach A一样执行smth,则生成您的niceudf(col1,col2);您将在0索引处收到一个包含col1值的元组(这意味着您可以使用Tuple.get(0);)和索引1处包含col2值的元组。如果您是第一次编写UDF,请以smth simple为例看一看谢谢。。。我已经完成了udf,它运行良好。谢谢你的帮助