python/pandas/numpy(或Excel)中每其他变量组合一个变量的摘要
我正在分析模型搜索的结果。结果保存在excel文件中,但可以很容易地导入python(或其他环境,如有必要)。 数据如下所示(就列和行的数量而言,这是一个简化版本): 我想分析kappa如何随测试数据而变化,所以我想知道类数、数据集类型和主题数恒定时的最小、最大和平均kappa。这看起来像这样: 我和pandas.groupy()鬼混过,但我似乎不太明白怎么做。任何帮助都是非常感激的 试试看: 用适当的值替换python/pandas/numpy(或Excel)中每其他变量组合一个变量的摘要,python,excel,pandas,numpy,csv,Python,Excel,Pandas,Numpy,Csv,我正在分析模型搜索的结果。结果保存在excel文件中,但可以很容易地导入python(或其他环境,如有必要)。 数据如下所示(就列和行的数量而言,这是一个简化版本): 我想分析kappa如何随测试数据而变化,所以我想知道类数、数据集类型和主题数恒定时的最小、最大和平均kappa。这看起来像这样: 我和pandas.groupy()鬼混过,但我似乎不太明白怎么做。任何帮助都是非常感激的 试试看: 用适当的值替换c1、c2、c3、c4: df.groupby(['c1', ‘c2’, ‘c3])
c1、c2、c3、c4
:
df.groupby(['c1', ‘c2’, ‘c3]).agg({'c4': [min, max, np.mean]})
很抱歉迟了回复,但这正是我想要的,非常感谢!