在使用任务限制/工作资源时,如何在dask.distributed中启用适当的工作窃取?
上下文 我正在使用dask.distributed跨机器并行计算。因此,我在连接到dask调度程序的不同机器上运行dask工作程序,然后我可以将自定义图与所需的密钥一起提交到该调度程序 由于网络装载限制,我的输入数据(和输出存储)仅可用于计算机的一个子集(“i/o主机”)。我试着用两种方法来处理这个问题:在使用任务限制/工作资源时,如何在dask.distributed中启用适当的工作窃取?,dask,dask-distributed,Dask,Dask Distributed,上下文 我正在使用dask.distributed跨机器并行计算。因此,我在连接到dask调度程序的不同机器上运行dask工作程序,然后我可以将自定义图与所需的密钥一起提交到该调度程序 由于网络装载限制,我的输入数据(和输出存储)仅可用于计算机的一个子集(“i/o主机”)。我试着用两种方法来处理这个问题: i/o操作中涉及的所有任务仅限于i/o主机(它们只能在有权访问数据的计算机上运行的辅助进程上运行),非i/o任务仅限于非i/o主机 i/o操作中涉及的所有任务都绑定到提供资源“io”(i/o主
有没有一种很好的方法可以将对任务的限制与偷工减料结合起来?这是对形势的一个很好的评估,也是一个公平的观点。我建议打开一个GitHub问题来长期跟踪它。谢谢!我将在此主题上打开GitHub问题。并在此处合并PR:。利用资源偷盗工作现在似乎奏效了(我自己还没有尝试过)!