Scikit learn sparkit学习中的分区和块

Scikit learn sparkit学习中的分区和块,scikit-learn,pyspark,Scikit Learn,Pyspark,我试图通过从Spark Python API调用scikit-learn额外树分类器算法来实现它。由于Spark在RDD上工作,并且scikit算法只需要数组、矩阵或数据帧,因此我遇到了sparkit learn()用于此目的。但是,我不理解sparkit使用的分区和块的概念

我试图通过从Spark Python API调用scikit-learn额外树分类器算法来实现它。由于Spark在RDD上工作,并且scikit算法只需要数组、矩阵或数据帧,因此我遇到了sparkit learn()用于此目的。但是,我不理解sparkit使用的分区和块的概念