Python 使用Groupby在Dask数据帧的新列中存储值_计数

Python 使用Groupby在Dask数据帧的新列中存储值_计数,python,pandas,dask,Python,Pandas,Dask,我曾经用它来计算和存储Pandas中某列的value_计数,并将结果存储在新列中 现在,我尝试对Dask数据帧执行相同的操作,但它会导致以下错误: df['new_column']=df.groupby(['A'])['B'].transform('count',meta='int').compute() ValueError:无法从重复轴重新编制索引 另外,df数据帧有四个分区 如何计算列A的值并将其存储在Dask中的new\u列中,与之相同?如果您不需要坚持使用transform(这是在最

我曾经用它来计算和存储Pandas中某列的value_计数,并将结果存储在新列中

现在,我尝试对Dask数据帧执行相同的操作,但它会导致以下错误:

df['new_column']=df.groupby(['A'])['B'].transform('count',meta='int').compute()
ValueError:无法从重复轴重新编制索引

另外,
df
数据帧有四个分区


如何计算列
A
的值并将其存储在Dask中的
new\u列
中,与之相同?

如果您不需要坚持使用
transform
(这是在最新的Dask版本中引入的),我建议您使用如下代码中的左合并


作为pd进口熊猫
将dask.dataframe作为dd导入
df=pd.DataFrame({“A”:[0,0,1,1,1,2,2],
“B”:[1,2,3,4,5,6,7]})
df=dd.from_熊猫(df,npartitions=2)
out=df.groupby(“A”)[“B”]\
.count()\
.compute()\
.重置索引(name=“新建列”)
df=dd.merge(df,out,on=[“A”],how=“left”)
您是否介意制作一个?