Join 你在spark中是如何工作的?

Join 你在spark中是如何工作的?,join,apache-spark,Join,Apache Spark,我试图理解如何执行broadcastHashJoin。 我知道这个小表被发送到所有节点,但是接下来结果会被发送回驱动程序吗? 我正在使用spark ui了解网络流量是如何管理的,但我没有得到相关结果,驱动程序结果总是空的: 为什么我看不见司机的车 要广播给驾驶员的关系 本地收集关系 哈希关系用于 并行计算连接 您看到的驱动程序中缺少的数据很可能与散列部分对应,而散列部分不会创建有用的度量

我试图理解如何执行broadcastHashJoin。 我知道这个小表被发送到所有节点,但是接下来结果会被发送回驱动程序吗? 我正在使用spark ui了解网络流量是如何管理的,但我没有得到相关结果,驱动程序结果总是空的: 为什么我看不见司机的车

  • 要广播给驾驶员的关系
  • 本地收集关系
  • 哈希关系用于
  • 并行计算连接
  • 您看到的驱动程序中缺少的数据很可能与散列部分对应,而散列部分不会创建有用的度量