Python 2.7 dask是如何在多个系统上实现的?
我是Dask库的新手。我想知道,如果我们在两个系统上使用Dask实现并行计算,那么我们应用计算的数据帧是否存储在两个系统上?实际上并行计算是如何发生的,文档中并不清楚 Dask数据帧是分块的,因此一般来说,在集群中有一个由较小的数据帧组成的大数据帧。计算分别应用于每个数据块,并在需要时对结果进行洗牌(例如groupby、sum和其他聚合任务)。这些数据块是隐式创建的还是我们给出了创建数据块的特定规范,如果是,如何创建?Python 2.7 dask是如何在多个系统上实现的?,python-2.7,parallel-processing,dask,dask-distributed,Python 2.7,Parallel Processing,Dask,Dask Distributed,我是Dask库的新手。我想知道,如果我们在两个系统上使用Dask实现并行计算,那么我们应用计算的数据帧是否存储在两个系统上?实际上并行计算是如何发生的,文档中并不清楚 Dask数据帧是分块的,因此一般来说,在集群中有一个由较小的数据帧组成的大数据帧。计算分别应用于每个数据块,并在需要时对结果进行洗牌(例如groupby、sum和其他聚合任务)。这些数据块是隐式创建的还是我们给出了创建数据块的特定规范,如果是,如何创建?