Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 当作业运行相当长的一段时间时,某些应用程序id的Spark UI速度较慢_Apache Spark - Fatal编程技术网

Apache spark 当作业运行相当长的一段时间时,某些应用程序id的Spark UI速度较慢

Apache spark 当作业运行相当长的一段时间时,某些应用程序id的Spark UI速度较慢,apache-spark,Apache Spark,当我在Spark UI中单击长时间运行的作业(比如24小时)的应用程序id时,加载阶段需要很长时间。我不知道它是否与spark配置或部署模式客户端连接。以下是我的spark配置的更多信息: --master yarn \ --deploy-mode client \ --driver-memory 12g \ --executor-memory 8g \ --executor-cores 4 \ --num-executors 108 \ UI正在驱动程序的计算机上运行。因此,如果机器内存不足

当我在Spark UI中单击长时间运行的作业(比如24小时)的应用程序id时,加载阶段需要很长时间。我不知道它是否与spark配置或部署模式客户端连接。以下是我的spark配置的更多信息:

--master yarn \
--deploy-mode client \
--driver-memory 12g \
--executor-memory 8g \
--executor-cores 4 \
--num-executors 108 \

UI正在驱动程序的计算机上运行。因此,如果机器内存不足,UI会变得非常慢

在这里,我看到您为驱动程序请求12GB的RAM。这是很多,如果这是机器上所有可用的内存,那么UI在某个时候变得非常慢是有道理的。此过程只应驱动计算并在工作人员之间共享

我猜你正在收集大量的数据,这通常不是一个好主意。(见附件)


更好的选择是将RDD写入文件或分布式数据库。

您的答案非常完美。我没有想到UI正在驱动程序的机器上运行。非常感谢你的回答。