Pyspark PypSpark中具有特定值zipWithIndex的开始索引_Pyspark_Pyspark Dataframes

Pyspark PypSpark中具有特定值zipWithIndex的开始索引

pyspark

Pyspark PypSpark中具有特定值zipWithIndex的开始索引,pyspark,pyspark-dataframes,Pyspark,Pyspark Dataframes,如果PypSpark中有任何参数可用于zipWithIndex（），我希望在数据帧中以特定值而不是默认值零开始索引值。以下解决方案将有助于以默认值启动zipWithIndex df = df_child.rdd.zipWithIndex().map(lambda x: (x[0], x[1] + index)).toDF() 其中，index是您希望从zipWithIndex开始的默认数字。您试图解决的更大问题是什么？如果重新运行作业，则会从上一个作业中获取max

如果PypSpark中有任何参数可用于zipWithIndex（），我希望在数据帧中以特定值而不是默认值零开始索引值。

以下解决方案将有助于以默认值启动zipWithIndex

df = df_child.rdd.zipWithIndex().map(lambda x: (x[0], x[1] + index)).toDF()

其中，index是您希望从zipWithIndex开始的默认数字。

您试图解决的更大问题是什么？如果重新运行作业，则会从上一个作业中获取max