Apache spark 如何在SparkR中并行化文本文件中的列

Apache spark 如何在SparkR中并行化文本文件中的列,apache-spark,sparkr,Apache Spark,Sparkr,我有一个文本文件,它是一个非常大的文件,只有几GB,看起来像这样 23 34 45 54 43 11 49 89 09 33 76 28 44 42 24 30 我想通过Spark R.1.6.0中的列对其进行并行化,但到目前为止我还不能。 我使用以下代码创建和RDD,并按行进行并行化 rdd <- SparkR:::textFile(sc, "file.txt", 4) rdd如何按列进行并行化是什么意思?您想并行化什么?当rdd时,如何按列并行化是什么意思?你想并行化什么?当rdd

我有一个文本文件,它是一个非常大的文件,只有几GB,看起来像这样

23 34 45 54
43 11 49 89
09 33 76 28
44 42 24 30
我想通过Spark R.1.6.0中的列对其进行并行化,但到目前为止我还不能。 我使用以下代码创建和RDD,并按行进行并行化

rdd <- SparkR:::textFile(sc, "file.txt", 4)

rdd如何按列进行并行化是什么意思?您想并行化什么?当rdd时,如何按列并行化是什么意思?你想并行化什么?当rdd