Python 为什么在pandas.pivot\u表中只计算一个边距为True的维度的总计?
pandas.pivot_表的示例显示了为行和列计算的总计,但对于me,总计仅为行计算 我可以在此设置中使用不同的数据帧重现此行为: Ubuntu 18.04、Python 3.6.7、Pandas 0.24.2Python 为什么在pandas.pivot\u表中只计算一个边距为True的维度的总计?,python,pandas,pivot-table,Python,Pandas,Pivot Table,pandas.pivot_表的示例显示了为行和列计算的总计,但对于me,总计仅为行计算 我可以在此设置中使用不同的数据帧重现此行为: Ubuntu 18.04、Python 3.6.7、Pandas 0.24.2 导入熊猫 df=1.DataFrame([ [“sec”,“2019-01”,1], [“sec”,“2019-02”,2], [“维护”,“2019-02”,1], [“维护”,“2019-03”,3] ]) 打印(df) #如果不以列表形式传递参数,则行为基本相同 p=df.piv
导入熊猫
df=1.DataFrame([
[“sec”,“2019-01”,1],
[“sec”,“2019-02”,2],
[“维护”,“2019-02”,1],
[“维护”,“2019-03”,3]
])
打印(df)
#如果不以列表形式传递参数,则行为基本相同
p=df.pivot\u表(
索引=[0],列=[1],值=[2],
aggfunc=“sum”,填充值=0。,
边距=真
)
印刷品(p)
输出:
0 1 2
0 sec 2019-01 1
1 sec 2019-02 2
2 maint 2019-02 1
3 maint 2019-03 3
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 0 0 0 7
正如您在最后一行中看到的,聚合不应用于列(最后一行除外),值仅为0
正如许多示例所建议的,我希望pivot\u表
能够产生以下结果:
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 1 3 3 7
我做错了什么或理解错了什么?或者这可能是一个bug?这是pandas中的一个bug,看起来只在数字列和
margins=True
时出现。解决方法是将数字列名临时强制转换为字符串:
In [1]: import pandas as pd; pd.__version__
Out[1]: '0.24.2'
In [2]: df = pd.DataFrame([
...: ["sec", "2019-01", 1],
...: ["sec", "2019-02", 2],
...: ["maint","2019-02", 1],
...: ["maint","2019-03",3]])
In [3]: # wrong output with numeric columns
...: df.pivot_table(index=[0], columns=[1], values=[2],
...: aggfunc="sum", fill_value=0., margins=True)
Out[3]:
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 0 0 0 7
In [4]: # correct output with string columns
...: df.columns = df.columns.map(str)
...: df.pivot_table(index=['0'], columns=['1'], values=['2'],
...: aggfunc="sum", fill_value=0., margins=True)
Out[4]:
2
1 2019-01 2019-02 2019-03 All
0
maint 0 1 3 4
sec 1 2 0 3
All 1 3 3 7