Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/jsp/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark Spark Streaming第一个作业比后续作业需要更多的时间_Apache Spark_Pyspark - Fatal编程技术网

Apache spark Spark Streaming第一个作业比后续作业需要更多的时间

Apache spark Spark Streaming第一个作业比后续作业需要更多的时间,apache-spark,pyspark,Apache Spark,Pyspark,我注意到,当我启动Spark Streaming应用程序时,即使没有输入数据,第一个作业也要比下面的作业花费更多的时间。我还注意到,当输入数据到达时,第一个作业需要的处理时间大于以下时间。这种行为有什么原因吗 谢谢如果您正在运行任何wide转换,则可能与spark.sql.shuffle.partitions有关值集如果您正在运行任何wide转换我有相同的问题,就像您可能与spark.sql.shuffle.partitions有关一样请回答我的问题

我注意到,当我启动Spark Streaming应用程序时,即使没有输入数据,第一个作业也要比下面的作业花费更多的时间。我还注意到,当输入数据到达时,第一个作业需要的处理时间大于以下时间。这种行为有什么原因吗


谢谢

如果您正在运行任何
wide转换,则可能与
spark.sql.shuffle.partitions有关
值集
如果您正在运行任何
wide转换
我有相同的问题,就像您可能与
spark.sql.shuffle.partitions有关一样请回答我的问题