Apache spark delta lake是否支持使用join更新?

Apache spark delta lake是否支持使用join更新?,apache-spark,databricks,delta,delta-lake,Apache Spark,Databricks,Delta,Delta Lake,是否可以使用join对delta lake表进行更新?在mysql(和其他数据库)中,您可以 update table x join table y on y.a=x.a set x.b=y.b where x.c='something' 我们在三角洲有类似的东西吗?我知道他们支持in和exists条款。他们的文档似乎没有提到任何关于更新连接的内容您可以使用MERGE-INTO命令来实现它。比如: merge into x using y on (x.a=y.a and x

是否可以使用join对delta lake表进行更新?在mysql(和其他数据库)中,您可以

update table x 
join table y on y.a=x.a 
set x.b=y.b
where x.c='something'

我们在三角洲有类似的东西吗?我知道他们支持in和exists条款。他们的文档似乎没有提到任何关于更新连接的内容

您可以使用MERGE-INTO命令来实现它。比如:

    merge into x using y
    on (x.a=y.a and x.c='something')
    when matched then
    update set x.b=y.b;

谢谢迪佩什。你知道我们如何使用连接优化,比如skew(..)@Ridwan你能描述一下你的用例吗?首先,您可以在此处查看性能改进: