Dataframe Pyspark:如何将一个数据帧中的一列替换为另一个数据帧中的另一列(列名相同)
我有两个数据帧:-Dataframe Pyspark:如何将一个数据帧中的一列替换为另一个数据帧中的另一列(列名相同),dataframe,pyspark,replace,merge,Dataframe,Pyspark,Replace,Merge,我有两个数据帧:- df_1 = spark.createDataFrame([(1,3,4),(3,4,5),(8,9,10)],['rats','dogs','cats']) rats dogs cats 1 3 4 3 4 5 8 9 10 df_2 = spark.createDataFrame([(11,13),(13,14),(18,12)],['dogs','cats']) dogs cats 11 1
df_1 = spark.createDataFrame([(1,3,4),(3,4,5),(8,9,10)],['rats','dogs','cats'])
rats dogs cats
1 3 4
3 4 5
8 9 10
df_2 = spark.createDataFrame([(11,13),(13,14),(18,12)],['dogs','cats'])
dogs cats
11 13
13 14
18 12
现在我们可以用df_2中的列狗替换df_1中的列狗吗
最终输出:-
rats dogs cats
1 11 4
3 13 5
8 18 10
您如何知道将
狗的哪个值放在哪一行?通常,Spark数据帧没有定义的顺序。