Apache spark 数据帧之间的差异

Apache spark 数据帧之间的差异,apache-spark,apache-spark-sql,Apache Spark,Apache Spark Sql,给定两个数据帧D1和D2,表示SQL中具有相同列和相同主键的两个表。找出两者区别的最佳方法是什么 差异包括: 1.D1中的所有记录不在D2中 2.D2中的所有记录不在D1中 3.与D2相比,D1中的任何更新记录 在数据帧上使用左半、左反连接 i、 e: 我会做一个完整的外部连接 df1.join(df2,joinExpr,"left_semi")(or)df1.join(df2,joinExpr,"left_anti")

给定两个数据帧D1和D2,表示SQL中具有相同列和相同主键的两个表。找出两者区别的最佳方法是什么

差异包括: 1.D1中的所有记录不在D2中 2.D2中的所有记录不在D1中
3.与D2相比,D1中的任何更新记录

在数据帧上使用左半、左反连接

i、 e:


我会做一个完整的外部连接
df1.join(df2,joinExpr,"left_semi")(or)df1.join(df2,joinExpr,"left_anti")