Apache spark Spark-RelationalGroupedDataset与KeyvalueGroupedDataset?我应该在什么时候使用它们?
在Spark中对Apache spark Spark-RelationalGroupedDataset与KeyvalueGroupedDataset?我应该在什么时候使用它们?,apache-spark,aggregation,apache-spark-dataset,Apache Spark,Aggregation,Apache Spark Dataset,在Spark中对数据集进行分组时,有两种方法:groupBy和groupByKey[K] groupBy返回RelationalGroupedDataset,而groupByKey[K]返回KeyvalueGroupedDataset 它们之间有什么区别? 在什么情况下我应该选择一种而不是另一种? 为什么我的问题是关于“数据集与数据帧”的问题的重复?我不明白。这显然是完全不同的事情!我的问题很具体,不是一般性的。标题是重复的,但实际问题不是。这是一个很遗憾的标记。这个问题应该重新打开,上面提到
数据集进行分组时,有两种方法:groupBy
和groupByKey[K]
groupBy
返回RelationalGroupedDataset
,而groupByKey[K]
返回KeyvalueGroupedDataset
它们之间有什么区别?
在什么情况下我应该选择一种而不是另一种?
为什么我的问题是关于“数据集与数据帧”的问题的重复?我不明白。这显然是完全不同的事情!我的问题很具体,不是一般性的。标题是重复的,但实际问题不是。这是一个很遗憾的标记。这个问题应该重新打开,上面提到的答案根本没有涵盖这个主题。这是一个有效的问题,应该重新打开。