Dask是否有熊猫替代品?

Dask是否有熊猫替代品?,dask,Dask,我想知道我是否可以用dask代替熊猫。我可能面临哪些问题 1) 我想对于较小的数据集,dask将比熊猫慢。我同意这一点,因为有时我不知道数据的大小,也不知道服务器配置 2) 我必须学习稍微不同的语法(例如compute) 我会面临dask dataframe无法完成pandas dataframe所能完成的任务的情况吗?这是一个非常广泛的问题。总的来说,我建议参考 Dask.dataframe并没有实现所有功能。这包括以下类型的操作: 变异操作 难以精确并行的运算,如中值运算(尽管近似解通常存在

我想知道我是否可以用dask代替熊猫。我可能面临哪些问题

1) 我想对于较小的数据集,dask将比熊猫慢。我同意这一点,因为有时我不知道数据的大小,也不知道服务器配置

2) 我必须学习稍微不同的语法(例如compute)


我会面临dask dataframe无法完成pandas dataframe所能完成的任务的情况吗?

这是一个非常广泛的问题。总的来说,我建议参考

Dask.dataframe并没有实现所有功能。这包括以下类型的操作:

  • 变异操作
  • 难以精确并行的运算,如中值运算(尽管近似解通常存在,如近似分位数)
  • 在数据帧的行上迭代
  • API中没有人费心复制的小角落 然而,因为dask数据帧只是许多小数据帧的集合,所以在简单的情况下,您通常可以绕过这些限制