Python 如何计算大熊猫的调和均值_Python_Pandas_Scipy

Python 如何计算大熊猫的调和均值

python pandas

Python 如何计算大熊猫的调和均值,python,pandas,scipy,Python,Pandas,Scipy,我有一个如下所示的数据框字数指每封电子邮件发送的字数 sender receiver words a b 10 a c 5 a c 15 b a 50 b a 30 我对熊猫比较陌生。我想计算1）两人之间发送的电子邮件数量2）两人之间发送的单词总数的调和平均数。如何使用scipy.stats中的hmean（）来获得所需的输出 sender receiver t

我有一个如下所示的数据框<代码>字数指每封电子邮件发送的字数

sender receiver words 
a        b       10
a        c       5
a        c       15
b        a       50
b        a       30

我对熊猫比较陌生。我想计算1）两人之间发送的电子邮件数量2）两人之间发送的单词总数的调和平均数。如何使用

scipy.stats

中的

hmean（）

来获得所需的输出

sender  receiver  total_emails  total_words
   a        b                   hmean([10])
   a        c                   hmean([5,15])
   b        a                   hmean([50,30])

对于电子邮件的总数，我不确定什么是正确的公式。任何帮助都将不胜感激

您可以使用

groupby

：

from scipy import stats
df = df.groupby(['sender', 'receiver']).agg(stats.hmean).reset_index(name='total_words')

输出：

  sender receiver  total_words
0      a        b         10.0
1      a        c          7.5
2      b        a         37.5

您可以使用

groupby

：

from scipy import stats
df = df.groupby(['sender', 'receiver']).agg(stats.hmean).reset_index(name='total_words')

输出：

  sender receiver  total_words
0      a        b         10.0
1      a        c          7.5
2      b        a         37.5

请从下一页重复和。“教我这项基本技术”不是堆栈溢出问题。我们希望您做出诚实的尝试，然后就您的算法或技术提出具体问题。堆栈溢出不是为了替换现有文档和教程。任何PANDAS教程都会教您如何将函数应用于

groupby

的结果。找一个

sum

或

mean

的例子，简单地用

hmean

替换该函数。我还想说，这个问题可以用不同的方式解释。i、 e.您可能会询问整个

df

的邮件总数，或者询问

发送方

接收方

的每一部分的邮件总数，因此您可能应该用一个示例进行说明。请重复并从。“教我这项基本技术”不是堆栈溢出问题。我们希望您做出诚实的尝试，然后就您的算法或技术提出具体问题。堆栈溢出不是为了替换现有文档和教程。任何PANDAS教程都会教您如何将函数应用于

groupby

的结果。找一个

sum

或

mean

的例子，简单地用

hmean

替换该函数。我还想说，这个问题可以用不同的方式解释。i、 e.您可能会询问整个

df

的邮件总数，或者询问

发送方

接收方

的每一部分的邮件总数，因此您可能应该举例说明。