Dask速度较慢,状态页中显示了许多磁盘读写块
我的Dask计算很慢。当我查看诊断仪表板的状态页面时,我发现大部分时间都花在Dask速度较慢,状态页中显示了许多磁盘读写块,dask,Dask,我的Dask计算很慢。当我查看诊断仪表板的状态页面时,我发现大部分时间都花在磁盘读取-*和磁盘写入-*任务上 这是什么意思 如何诊断此问题?当Dask工作进程开始耗尽内存时,他们会将额外的数据写入磁盘。这将作为磁盘写入-任务记录在状态页面中。当再次需要该数据时,会从磁盘读取该数据,并且状态页面上会显示一个磁盘读取-任务。您可以通过查看左上角的图来确认这一点,该图显示每个工作进程的内存使用情况,或者通过查看进度条的实心部分来确认这一点,该进度条显示仍在内存中的每种特定类型的任务数 解决此问题的方法
磁盘读取-*
和磁盘写入-*
任务上
这是什么意思
如何诊断此问题?当Dask工作进程开始耗尽内存时,他们会将额外的数据写入磁盘。这将作为
磁盘写入-
任务记录在状态页面中。当再次需要该数据时,会从磁盘读取该数据,并且状态页面上会显示一个磁盘读取-
任务。您可以通过查看左上角的图来确认这一点,该图显示每个工作进程的内存使用情况,或者通过查看进度条的实心部分来确认这一点,该进度条显示仍在内存中的每种特定类型的任务数
解决此问题的方法:
另外,Dask可能并不总是以最高效的方式处理文本数据。如果打开Dask配置文件
~/.Dask/config.yaml
并将工作内存目标:0.60
更改为工作内存目标:1.00
,您可能会看到性能改进。有关更多详细信息,请参阅。