Hive 在单个列上使用distinct,同时从配置单元中的其他列获取相应的数据

Hive 在单个列上使用distinct,同时从配置单元中的其他列获取相应的数据,hive,Hive,我的问题是如果我在蜂箱里有一张桌子 源-目的地 1---2 1---3 2---1 3---1 2---2 1---3 现在我需要为每个目的地获取不同的源值,所以输出如下 目的地源 1----2 3 2------12 3---1 其中源由ctrl+A'\0001'分隔 我尝试过很多事情,但我无法解决这个问题。 我们可以用一些蜂巢脚本来解决这个问题吗 谢谢和问候, Sreelatha.我认为收集集应该在这里工作。尝试运行此查询: select destination, collect_set(s

我的问题是如果我在蜂箱里有一张桌子

源-目的地

1---2

1---3

2---1

3---1

2---2

1---3

现在我需要为每个目的地获取不同的源值,所以输出如下

目的地源

1----2 3

2------12

3---1

其中源由ctrl+A'\0001'分隔

我尝试过很多事情,但我无法解决这个问题。 我们可以用一些蜂巢脚本来解决这个问题吗

谢谢和问候, Sreelatha.

我认为收集集应该在这里工作。尝试运行此查询:

select destination, collect_set(source) from table GROUP BY destination

非常感谢您的回复,Amar,但我们是否有任何方法可以替换输出中的逗号,以便以特定的分隔格式获得输出?如^A^A^A…并将此输出保存到文件中。将collect\u set的输出转换为字符串并执行regexp\u替换以获取所需的分隔符tank A ton Amar,这非常有用