Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 在Spark中通过公平调度实现并发_Apache Spark_Concurrency_Cassandra_Spark Thriftserver - Fatal编程技术网

Apache spark 在Spark中通过公平调度实现并发

Apache spark 在Spark中通过公平调度实现并发,apache-spark,concurrency,cassandra,spark-thriftserver,Apache Spark,Concurrency,Cassandra,Spark Thriftserver,我的环境: 我正试图通过Spark Thrift服务器连接Cassandra。然后,我在Hive Metastore中创建一个元表,其中保存Cassandra表数据。在web应用程序中,我通过JDBC驱动程序连接到元表。我已经为Spark Thrift Server启用了公平调度 问题: 当我通过JMeter对100个用户执行300秒的并发性负载测试时,初始请求的响应时间为亚秒(比如前30秒)。然后响应时间逐渐增加(如2到3秒)。当我检查Spark UI时,所有作业的执行时间都少于100毫秒。我

我的环境: 我正试图通过Spark Thrift服务器连接Cassandra。然后,我在Hive Metastore中创建一个元表,其中保存Cassandra表数据。在web应用程序中,我通过JDBC驱动程序连接到元表。我已经为Spark Thrift Server启用了公平调度

问题: 当我通过JMeter对100个用户执行300秒的并发性负载测试时,初始请求的响应时间为亚秒(比如前30秒)。然后响应时间逐渐增加(如2到3秒)。当我检查Spark UI时,所有作业的执行时间都少于100毫秒。我还注意到,当收到请求时,作业和任务处于挂起阶段。因此,我假设,即使任务执行需要亚秒的时间,调度程序也会延迟提交任务。如何修复作业提交中的延迟

以下是我的配置详细信息, 工人人数-2 每个工作人员的执行者数量-1 每个执行器的内核数-14 核心员工总数-30 每个执行器的内存-20Gb 辅助进程的总内存-106Gb

公平调度XML中的配置

<pool name="default">
    <schedulingMode>FAIR</schedulingMode>
    <weight>2</weight>
    <minShare>15</minShare>
  </pool>
  <pool name="test">
    <schedulingMode>FIFO</schedulingMode>
    <weight>2</weight>
    <minShare>3</minShare>
  </pool>

公平的
2.
15
先进先出
2.
3.

我正在Spark Standalone模式下执行。

这不是队列中待处理的案例查询,而其他查询正在运行。试着减少spark.locality。等待1s