Dataframe 通过列[PySpark]连接两个数据帧
我有两列,即每列的条目数相同Dataframe 通过列[PySpark]连接两个数据帧,dataframe,merge,pyspark,concatenation,Dataframe,Merge,Pyspark,Concatenation,我有两列,即每列的条目数相同 df1 = +-------+ | col1 | +-------+ | 10 | +-------+ | 3 | +-------+ ... df2 = +-------+ | col2 | +-------+ | 6 | +-------+ | 1 | +-------+ ... 我希望合并它们,以便最终数据帧具有以下形状: df3 = +-------+-------+ | col1 | col2 | +-------
df1 =
+-------+
| col1 |
+-------+
| 10 |
+-------+
| 3 |
+-------+
...
df2 =
+-------+
| col2 |
+-------+
| 6 |
+-------+
| 1 |
+-------+
...
我希望合并它们,以便最终数据帧具有以下形状:
df3 =
+-------+-------+
| col1 | col2 |
+-------+-------+
| 10 | 6 |
+-------+-------+
| 3 | 1 |
+-------+-------+
...
但我不能使用join方法,因为我没有尝试根据列标题合并列。如果有人对如何轻松实现这一点有任何建议,那将非常有帮助 试试这个
df1=df1..with columnCode,单调递增\u id
df2=df2..with columnCode,单调递增\u id
通过这种方式,您可以给它们都提供一列“代码”,您可以使用该列将两个df进行经典合并
df3=df2.joindf1,[code]试试这个
df1=df1..with columnCode,单调递增\u id
df2=df2..with columnCode,单调递增\u id
通过这种方式,您可以给它们都提供一列“代码”,您可以使用该列将两个df进行经典合并
df3=df2.joindf1,[code]检查这个,你可能对这个感兴趣-检查这个,你可能对这个感兴趣-