Hadoop 如何计算配置单元中两个数组的交集和并集?
例如,十字路口Hadoop 如何计算配置单元中两个数组的交集和并集?,hadoop,hive,hiveql,Hadoop,Hive,Hiveql,例如,十字路口 select intersect(array("A","B"), array("B","C")) 应该回来 ["B"] ["A","B","C"] 和工会 select union(array("A","B"), array("B","C")) 应该回来 ["B"] ["A","B","C"] 在蜂箱里做这个最好的方法是什么?我已经查看了hive文档,但找不到任何相关信息来执行此操作。您的问题解决方案在这里。转到,有很多自定义项是由klout创建的。下载、装箱罐子并
select intersect(array("A","B"), array("B","C"))
应该回来
["B"]
["A","B","C"]
和工会
select union(array("A","B"), array("B","C"))
应该回来
["B"]
["A","B","C"]
在蜂箱里做这个最好的方法是什么?我已经查看了hive文档,但找不到任何相关信息来执行此操作。您的问题解决方案在这里。转到,有很多自定义项是由klout创建的。下载、装箱罐子并将罐子添加到蜂箱中。范例
CREATE TEMPORARY FUNCTION combine AS 'brickhouse.udf.collect.CombineUDF';
CREATE TEMPORARY FUNCTION combine_unique AS 'brickhouse.udf.collect.CombineUniqueUDAF';
select combine_unique(combine(array('a','b','c'), array('b','c','d'))) from reqtable;
OK
["d","b","c","a"]
你的问题解决方案在这里。转到,有很多自定义项是由klout创建的。下载、装箱罐子并将罐子添加到蜂箱中。范例
CREATE TEMPORARY FUNCTION combine AS 'brickhouse.udf.collect.CombineUDF';
CREATE TEMPORARY FUNCTION combine_unique AS 'brickhouse.udf.collect.CombineUniqueUDAF';
select combine_unique(combine(array('a','b','c'), array('b','c','d'))) from reqtable;
OK
["d","b","c","a"]
您是否尝试过
选择数组(“A”、“B”)联合所有选择数组(“B”、“C”)
?您是否尝试过选择数组(“A”、“B”)联合所有选择数组(“B”、“C”)
?在上面的链接中找到的正确函数的可能重复项应该可以用作相交数组(array1,array2,…)
和asarray\u union(array1,array2,…)
在上面的链接中找到的正确函数应该是可以用作intersect\u array(array1,array2,…)
和asarray\u union(array1,array2,…)