Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/asp.net-mvc-3/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 星火物理计划;逻辑计划_Apache Spark - Fatal编程技术网

Apache spark 星火物理计划;逻辑计划

Apache spark 星火物理计划;逻辑计划,apache-spark,Apache Spark,我有两个问题: 在不添加任何额外代码来打印提交的spark作业的逻辑和物理计划的情况下,是否有办法查看在集群上运行的spark作业的物理和逻辑计划 是否有方法动态修改集群上正在运行的spark作业的执行计划,以获得更好的性能 请分享你的想法 提前谢谢 都是身体上的 val df: DataFrame = ??? df.queryExecution.executedPlan 可以使用queryExecutionproperties访问逻辑计划 df.queryExecution.logica

我有两个问题:

  • 在不添加任何额外代码来打印提交的spark作业的逻辑和物理计划的情况下,是否有办法查看在集群上运行的spark作业的物理和逻辑计划

  • 是否有方法动态修改集群上正在运行的spark作业的执行计划,以获得更好的性能

  • 请分享你的想法

    提前谢谢

  • 都是身体上的

    val df: DataFrame  = ???
    
    df.queryExecution.executedPlan
    
    可以使用
    queryExecution
    properties访问逻辑计划

    df.queryExecution.logical
    
  • 是的,您可以实现自己的优化器规则。该功能通常未正式记录,但有一些外部资源可用:


  • 好的,我想知道当作业在集群上运行时,我们如何看到完整的逻辑或物理计划。我想这篇文章可能会有所帮助