Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/315.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 为什么在pandas.pivot\u表中只计算一个边距为True的维度的总计?_Python_Pandas_Pivot Table - Fatal编程技术网

Python 为什么在pandas.pivot\u表中只计算一个边距为True的维度的总计?

Python 为什么在pandas.pivot\u表中只计算一个边距为True的维度的总计?,python,pandas,pivot-table,Python,Pandas,Pivot Table,pandas.pivot_表的示例显示了为行和列计算的总计,但对于me,总计仅为行计算 我可以在此设置中使用不同的数据帧重现此行为: Ubuntu 18.04、Python 3.6.7、Pandas 0.24.2 导入熊猫 df=1.DataFrame([ [“sec”,“2019-01”,1], [“sec”,“2019-02”,2], [“维护”,“2019-02”,1], [“维护”,“2019-03”,3] ]) 打印(df) #如果不以列表形式传递参数,则行为基本相同 p=df.piv

pandas.pivot_表的示例显示了为行和列计算的总计,但对于me,总计仅为行计算

我可以在此设置中使用不同的数据帧重现此行为:

Ubuntu 18.04、Python 3.6.7、Pandas 0.24.2

导入熊猫
df=1.DataFrame([
[“sec”,“2019-01”,1],
[“sec”,“2019-02”,2],
[“维护”,“2019-02”,1],
[“维护”,“2019-03”,3]
])
打印(df)
#如果不以列表形式传递参数,则行为基本相同
p=df.pivot\u表(
索引=[0],列=[1],值=[2],
aggfunc=“sum”,填充值=0。,
边距=真
)
印刷品(p)
输出:

       0        1  2
0    sec  2019-01  1
1    sec  2019-02  2
2  maint  2019-02  1
3  maint  2019-03  3

            2                    
1     2019-01 2019-02 2019-03 All
0                                
maint       0       1       3   4
sec         1       2       0   3
All         0       0       0   7
正如您在最后一行中看到的,聚合不应用于列(最后一行除外),值仅为0

正如许多示例所建议的,我希望
pivot\u表
能够产生以下结果:

            2                    
1     2019-01 2019-02 2019-03 All
0                                
maint       0       1       3   4
sec         1       2       0   3
All         1       3       3   7

我做错了什么或理解错了什么?或者这可能是一个bug?

这是pandas中的一个bug,看起来只在数字列和
margins=True
时出现。解决方法是将数字列名临时强制转换为字符串:

In [1]: import pandas as pd; pd.__version__
Out[1]: '0.24.2'

In [2]: df = pd.DataFrame([
   ...:     ["sec", "2019-01", 1],
   ...:     ["sec", "2019-02", 2],
   ...:     ["maint","2019-02", 1],
   ...:     ["maint","2019-03",3]])

In [3]: # wrong output with numeric columns
   ...: df.pivot_table(index=[0], columns=[1], values=[2],
   ...:                aggfunc="sum", fill_value=0., margins=True)
Out[3]:
            2
1     2019-01 2019-02 2019-03 All
0
maint       0       1       3   4
sec         1       2       0   3
All         0       0       0   7

In [4]: # correct output with string columns
   ...: df.columns = df.columns.map(str)
   ...: df.pivot_table(index=['0'], columns=['1'], values=['2'],
   ...:                aggfunc="sum", fill_value=0., margins=True)
Out[4]:
            2
1     2019-01 2019-02 2019-03 All
0
maint       0       1       3   4
sec         1       2       0   3
All         1       3       3   7