Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 基于列信息计算dataframe的统计信息_Python 3.x_Pandas - Fatal编程技术网

Python 3.x 基于列信息计算dataframe的统计信息

Python 3.x 基于列信息计算dataframe的统计信息,python-3.x,pandas,Python 3.x,Pandas,有一个数据框如下所示,它只显示4条记录 Identification cost weekdays 1001 $20.02 Tuesday 1002 $30.03 Monday 1004 $20.05 Wednesday 1006 $10.05 Tuesd

有一个数据框如下所示,它只显示4条记录

Identification      cost              weekdays
1001                $20.02            Tuesday
1002                $30.03             Monday
1004                $20.05            Wednesday
1006                $10.05            Tuesday

在熊猫中,如何计算统计数据,例如每个工作日成本的平均值、标准差。我是否应该使用groupby,以及如何在这种情况下使用它?

这可能包含两部分,首先将会计类型数据转换为数字,然后将
groupby
agg

df.cost=df.cost.replace( '[\$,]','', regex=True ).astype('float')
df.groupby('weekdays').cost.agg(['mean','std'])
Out[958]: 
             mean       std
weekdays                   
Monday     30.030       NaN
Tuesday    15.035  7.049855
Wednesday  20.050       NaN