Python 3.x 仅获取给定数据中特定列的统计信息
我有一个数据框,如下所示 数据帧Python 3.x 仅获取给定数据中特定列的统计信息,python-3.x,pandas,Python 3.x,Pandas,我有一个数据框,如下所示 数据帧 date location cpu mem drops upload download 2018-02-11 04:05:33.438948+05:30 DEL 44 23 5 14.5 44.51 2018-02-11 04:05:37.90
date location cpu mem drops upload download
2018-02-11 04:05:33.438948+05:30 DEL 44 23 5 14.5 44.51
2018-02-11 04:05:37.905242+05:30 MUM 0 23 6.08 5.1 0
2018-02-11 17:09:47.211344+05:30 DEL 24 34 4.19 19.4 37.53
2018-02-11 17:10:13.553385+05:30 KOL 23 35 4.47 11.5 46.34
我需要按小时显示指定日期所有小时的数据,但仅显示特定列的数据
我所做的是
hourly_stats = df.resample('H').agg(['mean', 'min', 'max', 'std']).fillna(0)
它为我提供了所有列的统计信息。但我只需要获取cpu
和drops
的统计信息
我试过做类似的事情,但没有成功
hourly_stats = df.groupby(['cpu', 'drops']).resample('H').agg(['mean', 'min', 'max', 'std']).fillna(0)
如何仅获取指定列的每小时统计信息?按子集筛选
重采样之后或之前的列:
hourly_stats = df.resample('H')['cpu', 'drops'].agg(['mean', 'min', 'max', 'std']).fillna(0)
或:
这就是我需要的。谢谢!嘿,我发布了另一个问题[你能帮我解决这个问题吗?@SouvikRay-我检查了一下,但不知道解决方案。对不起:(
hourly_stats = df[['cpu', 'drops']].resample('H').agg(['mean', 'min', 'max', 'std']).fillna(0)