Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop 如何计算配置单元中两个数组的交集和并集?_Hadoop_Hive_Hiveql - Fatal编程技术网

Hadoop 如何计算配置单元中两个数组的交集和并集?

Hadoop 如何计算配置单元中两个数组的交集和并集?,hadoop,hive,hiveql,Hadoop,Hive,Hiveql,例如,十字路口 select intersect(array("A","B"), array("B","C")) 应该回来 ["B"] ["A","B","C"] 和工会 select union(array("A","B"), array("B","C")) 应该回来 ["B"] ["A","B","C"] 在蜂箱里做这个最好的方法是什么?我已经查看了hive文档,但找不到任何相关信息来执行此操作。您的问题解决方案在这里。转到,有很多自定义项是由klout创建的。下载、装箱罐子并

例如,十字路口

select intersect(array("A","B"), array("B","C"))
应该回来

["B"]
["A","B","C"]
和工会

 select union(array("A","B"), array("B","C"))
应该回来

["B"]
["A","B","C"]

在蜂箱里做这个最好的方法是什么?我已经查看了hive文档,但找不到任何相关信息来执行此操作。

您的问题解决方案在这里。转到,有很多自定义项是由klout创建的。下载、装箱罐子并将罐子添加到蜂箱中。范例

 CREATE TEMPORARY FUNCTION combine AS 'brickhouse.udf.collect.CombineUDF';
 CREATE TEMPORARY FUNCTION combine_unique AS 'brickhouse.udf.collect.CombineUniqueUDAF';

select combine_unique(combine(array('a','b','c'), array('b','c','d'))) from reqtable;

OK
["d","b","c","a"]

你的问题解决方案在这里。转到,有很多自定义项是由klout创建的。下载、装箱罐子并将罐子添加到蜂箱中。范例

 CREATE TEMPORARY FUNCTION combine AS 'brickhouse.udf.collect.CombineUDF';
 CREATE TEMPORARY FUNCTION combine_unique AS 'brickhouse.udf.collect.CombineUniqueUDAF';

select combine_unique(combine(array('a','b','c'), array('b','c','d'))) from reqtable;

OK
["d","b","c","a"]

您是否尝试过
选择数组(“A”、“B”)联合所有选择数组(“B”、“C”)
?您是否尝试过
选择数组(“A”、“B”)联合所有选择数组(“B”、“C”)
?在上面的链接中找到的正确函数的可能重复项应该可以用作
相交数组(array1,array2,…)
和as
array\u union(array1,array2,…)
在上面的链接中找到的正确函数应该是可以用作
intersect\u array(array1,array2,…)
和as
array\u union(array1,array2,…)