Apache pig 用Pig拉丁语将元组字段的所有字段一起比较
我需要做的是: 比较我在一个字段(来自数据库)中得到的所有值,并检查它们是否都相等Apache pig 用Pig拉丁语将元组字段的所有字段一起比较,apache-pig,Apache Pig,我需要做的是: 比较我在一个字段(来自数据库)中得到的所有值,并检查它们是否都相等 A = (John,18,4.0F) (Mary,19,3.8F) (Bill,20,3.9F) (Joe,18,3.8F) 如果它们都相等,则返回值“true”;否则值为“false”。理想情况下,我需要一个字段级别的独立函数 此处第2列(称为$1将产生一个true,因为有2个'18'值) 我在考虑对包本身进行交叉连接,以便能够比较这些值,例如: (John, 18, 4.0F, Mary, 19 , .
A =
(John,18,4.0F)
(Mary,19,3.8F)
(Bill,20,3.9F)
(Joe,18,3.8F)
如果它们都相等,则返回值“true”;否则值为“false”。理想情况下,我需要一个字段级别的独立函数
此处第2列(称为$1将产生一个true,因为有2个'18'值)
我在考虑对包本身进行交叉连接,以便能够比较这些值,例如:
(John, 18, 4.0F, Mary, 19 , ..)
(Mary, 19, 3.8F, Bill, 20, .. )
然后能够将第2列和第5列(我的$1和$4)一起比较,这变得很简单
但业绩将受到影响。(但不确定这是否有效)。
还有其他想法吗
干杯,
Matt您可以编写清管器UDf并传递所有要在UDf中排序的值,然后仅比较相邻的值。如果您能更清楚地解释您的用例,这会有所帮助。请提供有关您正在尝试执行的操作的更多详细信息。示例输入和输出将非常有用。请编辑以添加示例。如果给定特定顺序,是否要比较相邻的记录对?