Dataframe 在pyspark中连接两个数据帧

Dataframe 在pyspark中连接两个数据帧,dataframe,pyspark,Dataframe,Pyspark,我有两个数据帧: df1 df2 然后我想合并这两个数据帧,得到以下数据帧: df3 如何在PySaprk中执行此操作?请尝试如下所示的交叉连接 df3 = df1.crossJoin(df2) df3.show() 这将提供您想要的输出。请尝试如下所示的交叉连接 df3 = df1.crossJoin(df2) df3.show() 这将提供您想要的输出 +----+----+----+----+ |key1|val1|key2|val2| +----+----+ |a1 | 1|a

我有两个数据帧:

df1 df2 然后我想合并这两个数据帧,得到以下数据帧:

df3
如何在PySaprk中执行此操作?

请尝试如下所示的交叉连接

df3 = df1.crossJoin(df2)
df3.show()

这将提供您想要的输出。

请尝试如下所示的交叉连接

df3 = df1.crossJoin(df2)
df3.show()
这将提供您想要的输出

+----+----+----+----+
|key1|val1|key2|val2|
+----+----+
|a1  |   1|a2  |   3|
|a1  |   1|b2  |   4|
|b1  |   2|a2  |   3|
|b1  |   2|b2  |   4|
+----+----+
df3 = df1.crossJoin(df2)
df3.show()