Apache spark Spark-RelationalGroupedDataset与KeyvalueGroupedDataset?我应该在什么时候使用它们?

Apache spark Spark-RelationalGroupedDataset与KeyvalueGroupedDataset?我应该在什么时候使用它们?,apache-spark,aggregation,apache-spark-dataset,Apache Spark,Aggregation,Apache Spark Dataset,在Spark中对数据集进行分组时,有两种方法:groupBy和groupByKey[K] groupBy返回RelationalGroupedDataset,而groupByKey[K]返回KeyvalueGroupedDataset 它们之间有什么区别? 在什么情况下我应该选择一种而不是另一种? 为什么我的问题是关于“数据集与数据帧”的问题的重复?我不明白。这显然是完全不同的事情!我的问题很具体,不是一般性的。标题是重复的,但实际问题不是。这是一个很遗憾的标记。这个问题应该重新打开,上面提到

在Spark中对
数据集进行分组时,有两种方法:
groupBy
groupByKey[K]

groupBy
返回
RelationalGroupedDataset
,而
groupByKey[K]
返回
KeyvalueGroupedDataset

它们之间有什么区别?

在什么情况下我应该选择一种而不是另一种?



为什么我的问题是关于“数据集与数据帧”的问题的重复?我不明白。这显然是完全不同的事情!我的问题很具体,不是一般性的。

标题是重复的,但实际问题不是。这是一个很遗憾的标记。这个问题应该重新打开,上面提到的答案根本没有涵盖这个主题。这是一个有效的问题,应该重新打开。