Apache spark Spark shuffle目录的大小不断增长

Apache spark Spark shuffle目录的大小不断增长,apache-spark,spark-streaming,Apache Spark,Spark Streaming,洗牌文件和数据文件在workers的block manager文件夹中存储多长时间?(spark-a0ab5241-1b5e-4c73-93ed-f37bbc479591) 我有一个spark流媒体工作,窗口持续时间为2小时,幻灯片间隔为15分钟 在块管理器路径中执行以下命令时 find . -type f -cmin +150 -name "shuffle*" -exec ls {} \; //command to find the shuffle files older than 2 hou

洗牌文件和数据文件在workers的block manager文件夹中存储多长时间?(spark-a0ab5241-1b5e-4c73-93ed-f37bbc479591)

我有一个spark流媒体工作,窗口持续时间为2小时,幻灯片间隔为15分钟

在块管理器路径中执行以下命令时

find . -type f -cmin +150 -name "shuffle*" -exec ls {} \; //command to find the shuffle files older than 2 hours 
我看到很多文件,这意味着他们没有得到清除,我希望他们应该得到清除。甚至还有昨天的档案

随后,该大小会不断增加并占用磁盘空间

请建议如何消除这种情况,并帮助理解这种行为