Python 如何根据第二列中的值计算一列的平均值?
我在一个数据框中有两列,我正在寻找Python中的以下解决方案 我的数据帧当前看起来如下所示:Python 如何根据第二列中的值计算一列的平均值?,python,dataframe,average,Python,Dataframe,Average,我在一个数据框中有两列,我正在寻找Python中的以下解决方案 我的数据帧当前看起来如下所示: columns: INDUSTRY Revenue Service 100 Manufacturing 50 Service 200 Manufacturing 100 Public 60 我想要的是数据框中每个行业类型的平均值
columns: INDUSTRY Revenue
Service 100
Manufacturing 50
Service 200
Manufacturing 100
Public 60
我想要的是数据框中每个行业类型的平均值:
columns: INDUSTRY Revenue
Service 150
Manufacturing 75
Public 60
我知道如何在R中使用函数表实现这一点,但我只是从python开始。谢谢您在python中,它被称为groupby,因为您的数据帧被称为Industry,您必须使用:
Industry.groupby('Industry')['Revenue'].mean()
关于stackoverflow,有几个例子:您的代码是必需的使用
.groupby()
谢谢,它可以工作。如果我想将groupby转换为DataFrame:pd.DataFrame(Industry),那么发生的情况是第一行的列不在同一级别上。列名称行业从第2行开始。我怎么才能解决这个问题呢?我不知道你到底是什么意思,但把它放回一个数据框:df2=Industry.goruby('Industry')['Revenue'].mean().reset_index()
应该能帮到你