Dataframe 通过列[PySpark]连接两个数据帧

Dataframe 通过列[PySpark]连接两个数据帧,dataframe,merge,pyspark,concatenation,Dataframe,Merge,Pyspark,Concatenation,我有两列,即每列的条目数相同 df1 = +-------+ | col1 | +-------+ | 10 | +-------+ | 3 | +-------+ ... df2 = +-------+ | col2 | +-------+ | 6 | +-------+ | 1 | +-------+ ... 我希望合并它们,以便最终数据帧具有以下形状: df3 = +-------+-------+ | col1 | col2 | +-------

我有两列,即每列的条目数相同

df1 =
+-------+
| col1  |
+-------+
|   10  |
+-------+
|   3   |
+-------+
...
df2 = 
+-------+
| col2  |
+-------+
|   6   |
+-------+
|   1   |
+-------+
...
我希望合并它们,以便最终数据帧具有以下形状:

df3 =
+-------+-------+
| col1  | col2  |
+-------+-------+
| 10    | 6     |
+-------+-------+
| 3     | 1     |
+-------+-------+
...
但我不能使用join方法,因为我没有尝试根据列标题合并列。如果有人对如何轻松实现这一点有任何建议,那将非常有帮助

试试这个

df1=df1..with columnCode,单调递增\u id df2=df2..with columnCode,单调递增\u id

通过这种方式,您可以给它们都提供一列“代码”,您可以使用该列将两个df进行经典合并

df3=df2.joindf1,[code]

试试这个

df1=df1..with columnCode,单调递增\u id df2=df2..with columnCode,单调递增\u id

通过这种方式,您可以给它们都提供一列“代码”,您可以使用该列将两个df进行经典合并


df3=df2.joindf1,[code]

检查这个,你可能对这个感兴趣-检查这个,你可能对这个感兴趣-