Python 如何计算大熊猫的调和均值
我有一个如下所示的数据框<代码>字数指每封电子邮件发送的字数Python 如何计算大熊猫的调和均值,python,pandas,scipy,Python,Pandas,Scipy,我有一个如下所示的数据框字数指每封电子邮件发送的字数 sender receiver words a b 10 a c 5 a c 15 b a 50 b a 30 我对熊猫比较陌生。我想计算1)两人之间发送的电子邮件数量2)两人之间发送的单词总数的调和平均数。如何使用scipy.stats中的hmean()来获得所需的输出 sender receiver t
sender receiver words
a b 10
a c 5
a c 15
b a 50
b a 30
我对熊猫比较陌生。我想计算1)两人之间发送的电子邮件数量2)两人之间发送的单词总数的调和平均数。如何使用scipy.stats
中的hmean()
来获得所需的输出
sender receiver total_emails total_words
a b hmean([10])
a c hmean([5,15])
b a hmean([50,30])
对于电子邮件的总数,我不确定什么是正确的公式。任何帮助都将不胜感激 您可以使用
groupby
:
from scipy import stats
df = df.groupby(['sender', 'receiver']).agg(stats.hmean).reset_index(name='total_words')
输出:
sender receiver total_words
0 a b 10.0
1 a c 7.5
2 b a 37.5
您可以使用
groupby
:
from scipy import stats
df = df.groupby(['sender', 'receiver']).agg(stats.hmean).reset_index(name='total_words')
输出:
sender receiver total_words
0 a b 10.0
1 a c 7.5
2 b a 37.5
请从下一页重复和。“教我这项基本技术”不是堆栈溢出问题。我们希望您做出诚实的尝试,然后就您的算法或技术提出具体问题。堆栈溢出不是为了替换现有文档和教程。任何PANDAS教程都会教您如何将函数应用于
groupby
的结果。找一个sum
或mean
的例子,简单地用hmean
替换该函数。我还想说,这个问题可以用不同的方式解释。i、 e.您可能会询问整个df
的邮件总数,或者询问发送方
接收方
的每一部分的邮件总数,因此您可能应该用一个示例进行说明。请重复并从。“教我这项基本技术”不是堆栈溢出问题。我们希望您做出诚实的尝试,然后就您的算法或技术提出具体问题。堆栈溢出不是为了替换现有文档和教程。任何PANDAS教程都会教您如何将函数应用于groupby
的结果。找一个sum
或mean
的例子,简单地用hmean
替换该函数。我还想说,这个问题可以用不同的方式解释。i、 e.您可能会询问整个df
的邮件总数,或者询问发送方
接收方
的每一部分的邮件总数,因此您可能应该举例说明。