Scala 使用ApacheSpark对字符串进行迭代

Scala 使用ApacheSpark对字符串进行迭代,scala,apache-spark,Scala,Apache Spark,例如,我们有字符串“abcdabcd” 我们要计算字符串中可用的所有对(例如:“ab”或“da”) 那么我们在ApacheSpark中如何做到这一点呢 我问这个问题是因为RDD似乎不支持滑动功能: rdd.sliding(2).toList //Count number of pairs in list //Returns syntax error on first line (sliding) 显然,它支持滑动过孔,如zero323所示 将显示 ab bc cd da ab bc 光盘 显然

例如,我们有字符串“abcdabcd”

我们要计算字符串中可用的所有对(例如:“ab”或“da”)

那么我们在ApacheSpark中如何做到这一点呢

我问这个问题是因为RDD似乎不支持滑动功能:

rdd.sliding(2).toList
//Count number of pairs in list
//Returns syntax error on first line (sliding)

显然,它支持滑动过孔,如zero323所示

将显示

ab
bc
cd
da
ab
bc
光盘


显然,它支持滑动过孔,如zero323所示

将显示

ab
bc
cd
da
ab
bc
光盘


我们如何计算这些对呢?顺便说一句,你看起来像是在这里搜寻我的scala问题的人:)@lkn2993使用
ApacheSark
中的经典方法,我们如何计算这些对?顺便说一句,你看起来像是在这里搜寻我的scala问题的人:)@lkn2993使用
ApacheSpark
import org.apache.spark.mllib.rdd.RDDFunctions._

val str = "abcdabcd"

val rdd = sc.parallelize(str)

rdd.sliding(2).map(_.mkString).toLocalIterator.forEach(println)