Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/363.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何计算大熊猫的调和均值_Python_Pandas_Scipy - Fatal编程技术网

Python 如何计算大熊猫的调和均值

Python 如何计算大熊猫的调和均值,python,pandas,scipy,Python,Pandas,Scipy,我有一个如下所示的数据框字数指每封电子邮件发送的字数 sender receiver words a b 10 a c 5 a c 15 b a 50 b a 30 我对熊猫比较陌生。我想计算1)两人之间发送的电子邮件数量2)两人之间发送的单词总数的调和平均数。如何使用scipy.stats中的hmean()来获得所需的输出 sender receiver t

我有一个如下所示的数据框<代码>字数指每封电子邮件发送的字数

sender receiver words 
a        b       10
a        c       5
a        c       15
b        a       50
b        a       30
我对熊猫比较陌生。我想计算1)两人之间发送的电子邮件数量2)两人之间发送的单词总数的调和平均数。如何使用
scipy.stats
中的
hmean()
来获得所需的输出

sender  receiver  total_emails  total_words
   a        b                   hmean([10])
   a        c                   hmean([5,15])
   b        a                   hmean([50,30])

对于电子邮件的总数,我不确定什么是正确的公式。任何帮助都将不胜感激

您可以使用
groupby

from scipy import stats
df = df.groupby(['sender', 'receiver']).agg(stats.hmean).reset_index(name='total_words')
输出:

  sender receiver  total_words
0      a        b         10.0
1      a        c          7.5
2      b        a         37.5

您可以使用
groupby

from scipy import stats
df = df.groupby(['sender', 'receiver']).agg(stats.hmean).reset_index(name='total_words')
输出:

  sender receiver  total_words
0      a        b         10.0
1      a        c          7.5
2      b        a         37.5

请从下一页重复和。“教我这项基本技术”不是堆栈溢出问题。我们希望您做出诚实的尝试,然后就您的算法或技术提出具体问题。堆栈溢出不是为了替换现有文档和教程。任何PANDAS教程都会教您如何将函数应用于
groupby
的结果。找一个
sum
mean
的例子,简单地用
hmean
替换该函数。我还想说,这个问题可以用不同的方式解释。i、 e.您可能会询问整个
df
的邮件总数,或者询问
发送方
接收方
的每一部分的邮件总数,因此您可能应该用一个示例进行说明。请重复并从。“教我这项基本技术”不是堆栈溢出问题。我们希望您做出诚实的尝试,然后就您的算法或技术提出具体问题。堆栈溢出不是为了替换现有文档和教程。任何PANDAS教程都会教您如何将函数应用于
groupby
的结果。找一个
sum
mean
的例子,简单地用
hmean
替换该函数。我还想说,这个问题可以用不同的方式解释。i、 e.您可能会询问整个
df
的邮件总数,或者询问
发送方
接收方
的每一部分的邮件总数,因此您可能应该举例说明。