Java 纱线中的火花作业-执行器长时间不执行任务

Java 纱线中的火花作业-执行器长时间不执行任务,java,apache-spark,yarn,Java,Apache Spark,Yarn,我可以从Spark UI中看到执行者长时间没有执行任务 当我看到executors选项卡stderr时,我可以看到下面的日志 6/02/04 05:30:56 INFO storage.MemoryStore: Block broadcast_91 of size 153016 dropped from memory (free 6665239401) 16/02/04 06:11:20 WARN hdfs.DFSClient: Slow ReadProcessor read fields to

我可以从Spark UI中看到执行者长时间没有执行任务

当我看到executors选项卡stderr时,我可以看到下面的日志

6/02/04 05:30:56 INFO storage.MemoryStore: Block broadcast_91 of size 153016 dropped from memory (free 6665239401)
16/02/04 06:11:20 WARN hdfs.DFSClient: Slow ReadProcessor read fields took 31337ms (threshold=30000ms); ack: seqno: 1240 status: SUCCESS status: SUCCESS status: SUCCESS downstreamAckTimeNanos: 4835789, targets: [DatanodeInfoWithStorage[10.25.36.18:1004,DS-f6e20cf7-0ccb-45aa-988f-f3310d5acf89,DISK], DatanodeInfoWithStorage[10.25.36.11:1004,DS-61ad0a2d-a6fd-402e-b0a1-61682d1755fb,DISK], DatanodeInfoWithStorage[10.25.36.5:1004,DS-c77503a2-0c7f-4b5c-8f4a-9c61cb4f18d7,DISK]]
我很长时间没有看到任何日志。我也没有看到错误。继续跑下去是很困难的

有人面临同样的问题吗?我们如何才能改进这一点

更新:


实际上,使用
saveAsTextFile()
方法花费了很长时间。

能否更新您使用的代码?能否指定Hadoop的版本?这似乎是版本2.5.0中的一个问题,但早在@GameOfThrows:我使用的是CDH 5.4.0发行版之前就已修复。在saveAtTextFile之前是否合并输出?这是很自然的,它会在这一行阻塞,这并不一定意味着保存过程才是真正的问题。@GameOfThrows:如果我想有效地合并输出文件呢?