Dataframe 将火花df转换为后续对的df

Dataframe 将火花df转换为后续对的df,dataframe,apache-spark,apache-spark-sql,Dataframe,Apache Spark,Apache Spark Sql,我试图实现的是将一个整数的火花df转换为连接每个后续元素的成对df,如下所示: [1, 7, 9, 10, 11] -> [(1, 7), (7, 9), (9, 10), (10, 11)] 我不知道有什么能让你这么做的。 也许有一些地图变化允许窥视下一个元素?或者使用RDD可能会允许这样的操作 在Scala Spark中,我将我的输入表示为: val input = Seq[Int](1, 7, 9, 10, 11) val inputRdd = spark.sparkContext

我试图实现的是将一个整数的火花df转换为连接每个后续元素的成对df,如下所示:

[1, 7, 9, 10, 11] -> [(1, 7), (7, 9), (9, 10), (10, 11)]
我不知道有什么能让你这么做的。 也许有一些地图变化允许窥视下一个元素?或者使用RDD可能会允许这样的操作

在Scala Spark中,我将我的输入表示为:

val input = Seq[Int](1, 7, 9, 10, 11)
val inputRdd = spark.sparkContext.parallelize(input)
val inputDf = spark.createDataFrame(inputRdd).toDF("point")

我想要的结果是一个具有两列的rdd。

这不是一个df@mck我用df inputspark更新了问题df无序。“下一个”元素没有很好的定义。如果您有办法确定元素的顺序,您可以创建一个数据框,然后在其上运行sql查询,类似于
选择点,LEAD(point)over()作为输入的点2。但是退一步——我相信您正在尝试的是将一个rdd的数字与自身连接起来,其中
t1.index=t2.index+1
。这里缺少的是每个元素的索引。