Apache spark Spark RDD treeReduce与Dataset reduce
Spark RDD有一个称为treeReduce的reduce变体,它非常有效,因为它通过将reduce作为一个层次结构来改进并行性 Spark数据集没有这种变化。数据集的reduce实现是否已经足够有效,或者是否有其他方法实现相同的行为Apache spark Spark RDD treeReduce与Dataset reduce,apache-spark,Apache Spark,Spark RDD有一个称为treeReduce的reduce变体,它非常有效,因为它通过将reduce作为一个层次结构来改进并行性 Spark数据集没有这种变化。数据集的reduce实现是否已经足够有效,或者是否有其他方法实现相同的行为