Pandas 数据帧分组操作

Pandas 数据帧分组操作,pandas,pandas-groupby,Pandas,Pandas Groupby,我有一个数据框中的事务列表,希望按符号进行分组,并取其中一列的总和。另外,我需要此列的第一个实例(每个符号) 我的代码: local_filename= 'C:\Users\\nshah\Desktop\Naman\TEMPLATE.xlsx' data_from_local_file = pd.read_excel(local_filename, error_bad_lines=False, sheet_name='JP_A') data_from_local_file = data_from

我有一个数据框中的事务列表,希望按
符号进行分组,并取其中一列的总和。另外,我需要此列的第一个实例(每个符号)

我的代码:

local_filename= 'C:\Users\\nshah\Desktop\Naman\TEMPLATE.xlsx'
data_from_local_file = pd.read_excel(local_filename, error_bad_lines=False, sheet_name='JP_A')
data_from_local_file = data_from_local_file[['Symbol','Security Name', 'Counterparty', 'Manager', 'Rate', 'LocatedAmt']]

data_grouped = data_from_local_file.groupby(['Symbol'])

pivoted  = data_grouped['LocatedAmt'].sum().reset_index()
下一步,我想第一个例子,让我们说相同的符号率


提前谢谢你

您可以按如下方式获得总和和第一个观测实例:

data_grouped = data_from_local_file.groupby(['Symbol'], as_index=False).agg({'LocatedAmt':[sum, 'first']})

要为所有列完成此操作,可以在所有列之间传递
agg
函数:

all_cols = ['Symbol','Security Name', 'Counterparty', 'Manager', 'Rate', 'LocatedAmt']
data_grouped_all = data_from_local_file.groupby(['Symbol'], as_index=False)[all_cols].agg([sum, 'first'])

你好请花点时间阅读这篇关于(第一个答案中丑陋的)的帖子,以及如何提供答案,并相应地修改你的问题。这些提示可能也很有用。