Python 如何找出我的Dask数据帧使用了多少工人?

Python 如何找出我的Dask数据帧使用了多少工人?,python,dask,dask-distributed,Python,Dask,Dask Distributed,我可以在一台机器上使用Dask,没有问题 将dask.dataframe作为dd导入 a=dd.read\u拼花:/data/p03.parquet,columns=var0 aa=a.value\u counts.compute 但我如何知道它使用了多少工人或流程?我试过了 从dask.distributed导入客户端 客户 它表明 客户机:调度程序tcp://127.0.0.1:56688'进程=4个核心=12个 这是否意味着我的数据帧操作使用了4个进程?这意味着它有4个进程,每个进程有3个

我可以在一台机器上使用Dask,没有问题

将dask.dataframe作为dd导入 a=dd.read\u拼花:/data/p03.parquet,columns=var0 aa=a.value\u counts.compute 但我如何知道它使用了多少工人或流程?我试过了

从dask.distributed导入客户端 客户 它表明

客户机:调度程序tcp://127.0.0.1:56688'进程=4个核心=12个


这是否意味着我的数据帧操作使用了4个进程?

这意味着它有4个进程,每个进程有3个线程可用于您的操作。根据您的计算,您可能希望将其调整为更多线程和更少进程,通常更好地用于释放解释器锁的事情,例如数字工作,或更多进程和更少线程,通常更好地用于需要解释器锁的事情,例如字符串处理

要了解操作的实际计算方式,请参阅诊断文档,尤其是仪表板上的文档: