Python 如何使用.agg方法计算熊猫中的列平均值_Python_Pandas_Dataframe

Python 如何使用.agg方法计算熊猫中的列平均值

python pandas dataframe

Python 如何使用.agg方法计算熊猫中的列平均值,python,pandas,dataframe,Python,Pandas,Dataframe,我知道.agg可以很容易地用于计算平均值。例如，如果我有一个数据帧df： df one two three A 1 2 3 B 4 5 6 C 7 8 9 我想计算每列的平均值，我可以这样做： df.agg(np.average) one 4.0 two 5.0 three 6.0 dtype: float64 现在，假设我只对“一”

我知道.agg可以很容易地用于计算平均值。例如，如果我有一个数据帧df：

df
       one  two  three
   A    1    2      3
   B    4    5      6
   C    7    8      9

我想计算每列的平均值，我可以这样做：

df.agg(np.average)
    one      4.0
    two      5.0
    three    6.0
    dtype: float64

现在，假设我只对“一”的平均值感兴趣。直觉上，我是这样写的，我期待一个数字4：

df.agg({'one':np.average})   #or df['one'].agg(np.average)

但是，它返回的不是4，而是第一列：

       one
    A  1.0
    B  4.0
    C  7.0

为什么？

有很多方法可以做到这一点，而你似乎偶然发现了唯一不起作用的方法。这些都对我有用：

df["one"].agg("mean")

df.agg({"one": "mean"})

df["one"].agg(np.mean)

df.agg({"one": np.mean})

查看源代码，当您使用

average

时，它似乎将

DataFrame

转换为numpy

array

，然后

mean

默认采用行平均值。因为在基本情况下（无权重）

average

实际上调用了

mean

看

及

您是否尝试过

df.agg（{'one'：'mean'}）

或

df[['one']].agg（np.average）

？您也可以尝试：

df['one'].agg（'mean'，axis=0）

为什么我们需要agg？df.mean（）@Wen我知道还有其他方法，但我只是想弄清楚为什么这个方法不起作用。@C8H10N4O2它起作用了！你能详细解释一下为什么第二个有效吗？

def mean(a, axis=None, dtype=None, out=None, keepdims=np._NoValue):

    kwargs = {}
    if keepdims is not np._NoValue:
        kwargs['keepdims'] = keepdims
    if type(a) is not mu.ndarray:
        try:
            mean = a.mean
        except AttributeError:
            pass
        else:
            return mean(axis=axis, dtype=dtype, out=out, **kwargs)

    return _methods._mean(a, axis=axis, dtype=dtype,
                      out=out, **kwargs)

def average(a, axis=None, weights=None, returned=False):

    if (type(a) not in (np.ndarray, np.matrix) and
            issubclass(type(a), np.ndarray)):
        warnings.warn("np.average currently does not preserve subclasses, but "
                      "will do so in the future to match the behavior of most "
                      "other numpy functions such as np.mean. In particular, "
                      "this means calls which returned a scalar may return a "
                      "0-d subclass object instead.",
                      FutureWarning, stacklevel=2)

    if not isinstance(a, np.matrix):
        a = np.asarray(a)

    if weights is None:
        avg = a.mean(axis)
        scl = avg.dtype.type(a.size/avg.size)
    else:
        ...