Apache spark 如何在SparkR中并行化文本文件中的列_Apache Spark_Sparkr

Apache spark 如何在SparkR中并行化文本文件中的列

apache-spark

Apache spark 如何在SparkR中并行化文本文件中的列,apache-spark,sparkr,Apache Spark,Sparkr,我有一个文本文件，它是一个非常大的文件，只有几GB，看起来像这样 23 34 45 54 43 11 49 89 09 33 76 28 44 42 24 30 我想通过Spark R.1.6.0中的列对其进行并行化，但到目前为止我还不能。我使用以下代码创建和RDD，并按行进行并行化 rdd <- SparkR:::textFile(sc, "file.txt", 4) rdd如何按列进行并行化是什么意思？您想并行化什么？当rdd时，如何按列并行化是什么意思？你想并行化什么？当rdd

我有一个文本文件，它是一个非常大的文件，只有几GB，看起来像这样

23 34 45 54
43 11 49 89
09 33 76 28
44 42 24 30

我想通过Spark R.1.6.0中的列对其进行并行化，但到目前为止我还不能。我使用以下代码创建和RDD，并按行进行并行化

rdd <- SparkR:::textFile(sc, "file.txt", 4)

rdd如何按列进行并行化是什么意思？您想并行化什么？当rdd时，如何按列并行化是什么意思？你想并行化什么？当rdd