Python 如何根据第二列中的值计算一列的平均值?

Python 如何根据第二列中的值计算一列的平均值?,python,dataframe,average,Python,Dataframe,Average,我在一个数据框中有两列,我正在寻找Python中的以下解决方案 我的数据帧当前看起来如下所示: columns: INDUSTRY Revenue Service 100 Manufacturing 50 Service 200 Manufacturing 100 Public 60 我想要的是数据框中每个行业类型的平均值

我在一个数据框中有两列,我正在寻找Python中的以下解决方案

我的数据帧当前看起来如下所示:

columns: INDUSTRY         Revenue
         Service          100
         Manufacturing    50
         Service          200
         Manufacturing    100
         Public           60
我想要的是数据框中每个行业类型的平均值:

columns: INDUSTRY         Revenue
         Service          150
         Manufacturing    75
         Public           60

我知道如何在R中使用函数表实现这一点,但我只是从python开始。谢谢您

在python中,它被称为groupby,因为您的数据帧被称为Industry,您必须使用:

Industry.groupby('Industry')['Revenue'].mean()


关于stackoverflow,有几个例子:

您的代码是必需的使用
.groupby()
谢谢,它可以工作。如果我想将groupby转换为DataFrame:pd.DataFrame(Industry),那么发生的情况是第一行的列不在同一级别上。列名称行业从第2行开始。我怎么才能解决这个问题呢?我不知道你到底是什么意思,但把它放回一个数据框:
df2=Industry.goruby('Industry')['Revenue'].mean().reset_index()
应该能帮到你