如何在Dask中为GroupBy添加自定义聚合函数?例如平均值、模式、中位数、第95百分位等

如何在Dask中为GroupBy添加自定义聚合函数?例如平均值、模式、中位数、第95百分位等,dask,dask-dataframe,Dask,Dask Dataframe,我无法理解以下代码中的chunk、agg和finalize是什么 mode = dd.Aggregation('mode', chunk, agg, finalize) 同时,对其类型和实现方式进行了分析。 是否有人可以在Dask的中为我提供指导/帮助?在Dask.dataframe.Aggregation的docstring中用示例描述了chunk、agg和finalize,该文档可在线获取: 如果您有关于该解释的特定问题需要澄清,那么我鼓励您具体提及。是的,我理解。但现在我无法开发/理解用

我无法理解以下代码中的chunk、agg和finalize是什么

mode = dd.Aggregation('mode', chunk, agg, finalize)
同时,对其类型和实现方式进行了分析。
是否有人可以在Dask的中为我提供指导/帮助?

Dask.dataframe.Aggregation
的docstring中用示例描述了
chunk
agg
finalize
,该文档可在线获取:


如果您有关于该解释的特定问题需要澄清,那么我鼓励您具体提及。

是的,我理解。但现在我无法开发/理解用于计算分组数据的第95百分位、中位数、不同变量、模式聚合的逻辑。如果您有,请您为我提供一些相同的代码片段@MRocklinI建议对这些算法的并行版本进行web搜索。你所要求的不是微不足道的。