使用数据透视表（pandas）中的小计行时保留索引部分（不同列）_Pandas_Pivot Table_Pandas Groupby_Subtotal

使用数据透视表（pandas）中的小计行时保留索引部分（不同列）

pandas

使用数据透视表（pandas）中的小计行时保留索引部分（不同列）,pandas,pivot-table,pandas-groupby,subtotal,Pandas,Pivot Table,Pandas Groupby,Subtotal,我试图在数据透视表中添加小计行（使用pandas pd.pivot\u表）。这是代码table=pd.pivot\u表（df，value=['Quantity'、'Money'、'Cost']，index=['house'、'date'、'currency'、'family name']，columns=[]，fill\u value=0，aggfunc=np.sum）。这是相应的输出（导出到excel）：然后，我尝试使用house作为参考来获取小计行。我按照此链接中所述的步骤创建了一个组，

我试图在数据透视表中添加小计行（使用pandas pd.pivot\u表）。这是代码

table=pd.pivot\u表（df，value=['Quantity'、'Money'、'Cost']，index=['house'、'date'、'currency'、'family name']，columns=[]，fill\u value=0，aggfunc=np.sum）

。这是相应的输出（导出到excel）：

然后，我尝试使用

house

作为参考来获取小计行。我按照此链接中所述的步骤创建了一个组，使用

tablesum=table.groupby（level='house'）.sum（）

。在我尝试连接

table

和

tablesum

数据帧之前，一切似乎都很好。这是我（为家庭A）得到的：

基本上，我只在一列（用逗号分隔）中获得了表索引中所述的四个类别（房屋、日期、货币、姓氏）。所以，即使我按房屋进行小计，我也失去了pivot\u表的分隔。所以，我的问题是：我如何保持它（在不同的列中维护pivot_表的索引）
任何帮助都将受到高度重视
问候,

pd：我也检查了这个链接，但这给了我另一种与字符串和数字相关的错误。
你可以使用transform在goupby之后保留原始的表布局。因此，下面可能会给出您想要的结果

table.groupby(level='house').transform("sum")
如果这不是你想要的，请澄清

您可以使用
4
级别创建自定义的
多索引
，然后分配
注意：第二级
date
必须转换为字符串，因为concat也使用字符串，否则会得到：
TypeError:无法将类型“Timestamp”与类型“str”进行比较

你们能提供一些测试数据来说明发生了什么吗？我完全编辑了答案，请检查一下。谢谢！关于这一点，我想问你另一个问题。我为房子{'a'：10，'b'：100'}创建了一本字典。是否可以使用map将其链接到新的数据帧（df）。我正在尝试，但出现了一个错误：“关键错误屋”
df = pd.DataFrame({'house':list('aaaaabbbbb'), 'date':['2015-01-01'] * 3 + ['2015-01-02'] * 2 + ['2015-01-01'] * 3 +['2015-01-02'] * 2, 'currency':['USD'] * 3 + ['NK'] * 2 + ['USD'] * 3 +['NK'] * 2, 'Quantity':[1,3,5,7,1,0,7,2,3,9], 'Money':[5,3,6,9,2,4,7,2,3,9], 'Cost':[5,3,6,9,2,4,7,2,3,9], 'family name':list('aabbccaabb')}) print (df) Cost Money Quantity currency date family name house 0 5 5 1 USD 2015-01-01 a a 1 3 3 3 USD 2015-01-01 a a 2 6 6 5 USD 2015-01-01 b a 3 9 9 7 NK 2015-01-02 b a 4 2 2 1 NK 2015-01-02 c a 5 4 4 0 USD 2015-01-01 c b 6 7 7 7 USD 2015-01-01 a b 7 2 2 2 USD 2015-01-01 a b 8 3 3 3 NK 2015-01-02 b b 9 9 9 9 NK 2015-01-02 b b

#convert only for subtotal - join with empty strings df['date'] = df['date'].astype(str) table = pd.pivot_table(df, values= ['Quantity', 'Money', 'Cost'], index=['house','date', 'currency', 'family name'], fill_value=0, aggfunc=np.sum) print (table) Cost Money Quantity house date currency family name a 2015-01-01 USD a 8 8 4 b 6 6 5 2015-01-02 NK b 9 9 7 c 2 2 1 b 2015-01-01 USD a 9 9 9 c 4 4 0 2015-01-02 NK b 12 12 12

tablesum = table.groupby(level='house').sum() tablesum.index = pd.MultiIndex.from_arrays([tablesum.index.get_level_values(0)+ '_sum', len(tablesum.index) * [''], len(tablesum.index) * [''], len(tablesum.index) * ['']]) print (tablesum) Cost Money Quantity a_sum 25 25 17 b_sum 25 25 21 print (tablesum.index) MultiIndex(levels=[['a_sum', 'b_sum'], [''], [''], ['']], labels=[[0, 1], [0, 0], [0, 0], [0, 0]]) df = pd.concat([table, tablesum]).sort_index(level=0) print (df) Cost Money Quantity house date currency family name a 2015-01-01 USD a 8 8 4 b 6 6 5 2015-01-02 NK b 9 9 7 c 2 2 1 a_sum 25 25 17 b 2015-01-01 USD a 9 9 9 c 4 4 0 2015-01-02 NK b 12 12 12 b_sum 25 25 21