Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/amazon-s3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 在执行者之间均匀分配任务_Apache Spark_Amazon S3_Emr - Fatal编程技术网

Apache spark 在执行者之间均匀分配任务

Apache spark 在执行者之间均匀分配任务,apache-spark,amazon-s3,emr,Apache Spark,Amazon S3,Emr,正在尝试使用EMR读取存储在s3中的csv文件(spark.read.csv(“s3://…))。s3存储桶中大约有100个文件,EMR集群中大约有300个实例,每个实例有两个执行器(每个7个核心).我可以在spark UI中看到,几乎所有的任务都只分配给10个执行者,每个执行者有10个任务,而不是分配给不同的执行者,以利用并行处理每个文件的优势 是否有一个旋钮强制任务分配到所有执行者 spark.dynamicAllocation.enabled设置为false,spark.executor.

正在尝试使用EMR读取存储在s3中的csv文件(
spark.read.csv(“s3://…)
)。s3存储桶中大约有100个文件,EMR集群中大约有300个实例,每个实例有两个执行器(每个7个核心).我可以在spark UI中看到,几乎所有的任务都只分配给10个执行者,每个执行者有10个任务,而不是分配给不同的执行者,以利用并行处理每个文件的优势

是否有一个旋钮强制任务分配到所有执行者

spark.dynamicAllocation.enabled
设置为
false
spark.executor.instances
设置为群集中的执行器数量