Python 3.x 基于列信息计算dataframe的统计信息
有一个数据框如下所示,它只显示4条记录Python 3.x 基于列信息计算dataframe的统计信息,python-3.x,pandas,Python 3.x,Pandas,有一个数据框如下所示,它只显示4条记录 Identification cost weekdays 1001 $20.02 Tuesday 1002 $30.03 Monday 1004 $20.05 Wednesday 1006 $10.05 Tuesd
Identification cost weekdays
1001 $20.02 Tuesday
1002 $30.03 Monday
1004 $20.05 Wednesday
1006 $10.05 Tuesday
在熊猫中,如何计算统计数据,例如每个工作日成本的平均值、标准差。我是否应该使用groupby,以及如何在这种情况下使用它?这可能包含两部分,首先将会计类型数据转换为数字,然后将
groupby
与agg
df.cost=df.cost.replace( '[\$,]','', regex=True ).astype('float')
df.groupby('weekdays').cost.agg(['mean','std'])
Out[958]:
mean std
weekdays
Monday 30.030 NaN
Tuesday 15.035 7.049855
Wednesday 20.050 NaN