Apache spark Spark Streaming第一个作业比后续作业需要更多的时间
我注意到,当我启动Spark Streaming应用程序时,即使没有输入数据,第一个作业也要比下面的作业花费更多的时间。我还注意到,当输入数据到达时,第一个作业需要的处理时间大于以下时间。这种行为有什么原因吗Apache spark Spark Streaming第一个作业比后续作业需要更多的时间,apache-spark,pyspark,Apache Spark,Pyspark,我注意到,当我启动Spark Streaming应用程序时,即使没有输入数据,第一个作业也要比下面的作业花费更多的时间。我还注意到,当输入数据到达时,第一个作业需要的处理时间大于以下时间。这种行为有什么原因吗 谢谢如果您正在运行任何wide转换,则可能与spark.sql.shuffle.partitions有关值集如果您正在运行任何wide转换我有相同的问题,就像您可能与spark.sql.shuffle.partitions有关一样请回答我的问题
谢谢如果您正在运行任何
wide转换,则可能与spark.sql.shuffle.partitions有关
值集
如果您正在运行任何wide转换
我有相同的问题,就像您可能与spark.sql.shuffle.partitions有关一样请回答我的问题