Apache pig 用Pig拉丁语将元组字段的所有字段一起比较

Apache pig 用Pig拉丁语将元组字段的所有字段一起比较,apache-pig,Apache Pig,我需要做的是: 比较我在一个字段(来自数据库)中得到的所有值,并检查它们是否都相等 A = (John,18,4.0F) (Mary,19,3.8F) (Bill,20,3.9F) (Joe,18,3.8F) 如果它们都相等,则返回值“true”;否则值为“false”。理想情况下,我需要一个字段级别的独立函数 此处第2列(称为$1将产生一个true,因为有2个'18'值) 我在考虑对包本身进行交叉连接,以便能够比较这些值,例如: (John, 18, 4.0F, Mary, 19 , .

我需要做的是: 比较我在一个字段(来自数据库)中得到的所有值,并检查它们是否都相等

A = 
(John,18,4.0F)
(Mary,19,3.8F)
(Bill,20,3.9F)
(Joe,18,3.8F)
如果它们都相等,则返回值“true”;否则值为“false”。理想情况下,我需要一个字段级别的独立函数

此处第2列(称为$1将产生一个true,因为有2个'18'值)

我在考虑对包本身进行交叉连接,以便能够比较这些值,例如:

 (John, 18, 4.0F, Mary, 19 , ..)
 (Mary, 19, 3.8F, Bill, 20, .. )

然后能够将第2列和第5列(我的$1和$4)一起比较,这变得很简单

但业绩将受到影响。(但不确定这是否有效)。 还有其他想法吗

干杯,
Matt

您可以编写清管器UDf并传递所有要在UDf中排序的值,然后仅比较相邻的值。如果您能更清楚地解释您的用例,这会有所帮助。

请提供有关您正在尝试执行的操作的更多详细信息。示例输入和输出将非常有用。请编辑以添加示例。如果给定特定顺序,是否要比较相邻的记录对?