Pandas 统计数据透视表中的注释数
我有一个问题,需要计算透视表中的注释数。注释在数据集中的行级别以文本形式出现。我需要做的是沿着索引列和另一个值函数计算注释的数量。我正在使用以下代码:Pandas 统计数据透视表中的注释数,pandas,pivot-table,pandas-groupby,Pandas,Pivot Table,Pandas Groupby,我有一个问题,需要计算透视表中的注释数。注释在数据集中的行级别以文本形式出现。我需要做的是沿着索引列和另一个值函数计算注释的数量。我正在使用以下代码: pivot_account= pd.pivot_table(data_account, values=['Account_type', 'Comment'], index=['Function'], aggfunc={'Account_type': lambda x: x.count(),
pivot_account= pd.pivot_table(data_account, values=['Account_type', 'Comment'], index=['Function'],
aggfunc={'Account_type': lambda x: x.count(),
'Comment': lambda x: x.count()})
pivot_account
列注释是由所有注释组成的分类列。但我需要有价值的东西。就这样。
所以枢轴应该是这样的
Function Account_Type Comment
HR . 2 10
IT . 4 20
也就是说,人力资源部。该部门共收到20条评论。我不关心在这个级别上查看评论
当我运行上面的代码时,我得到了类似的Account_类型和Comment输出,并且没有错误
Function
Account_Type COMMENT
Business Development 3 3
以此类推,到处都是相同的数字
数据帧如下所示
Function Account_Type COMMENT
HR 1 XYZ
HR 1 ABC
HR 1 BCD
IT 1 Hello
IT 1 How Are you
因此,输出应该是total account_类型变量的计数和函数的注释计数请阅读和。特别是(至少)拥有您原始df的样本将非常好。您能否分享一个您的
data\u帐户
的示例(通过编辑您的问题将其包括在内)aggfunc='count'
?@rpanai:用结构更新了数据帧。@politicalscientist:不确定最好的计数方法,所以在那里使用了lambda函数。我知道这不是一个聚合函数,但els对我来说什么都不起作用。