Python 如何是';总和';和';第一';在与DataFrame.Series相关的字典中?
我当时正在学习市场分析学,并坚持了下面的片段,即var操作。 “sum”和“firs”如何给出列的和以及列中“first”的首个唯一值Python 如何是';总和';和';第一';在与DataFrame.Series相关的字典中?,python,pandas,Python,Pandas,我当时正在学习市场分析学,并坚持了下面的片段,即var操作。 “sum”和“firs”如何给出列的和以及列中“first”的首个唯一值 operations = {'revenue':'sum', 'InvoiceDate':'first', 'CustomerID':'first'} df = df.groupby('InvoiceNo').agg(operat
operations = {'revenue':'sum',
'InvoiceDate':'first',
'CustomerID':'first'}
df = df.groupby('InvoiceNo').agg(operations)
我想把它和pandas.Series.first和pandas.Series.sum联系起来,但找不到例子
书籍说明:
在前面的代码片段中,我们首先指定了将用于每个列的聚合函数,然后执行groupby并应用这些函数。同一发票的所有行的InvoiceDate和CustomerID都相同,因此我们可以为它们选择第一个条目。对于收入,我们将同一发票的所有项目的收入相加,以获得该发票的总收入
结果:
revenue InvoiceDate CustomerID
InvoiceNo
581583 124.60 2011-12-09 12:23:00 13777.0
581584 140.64 2011-12-09 12:25:00 13777.0
581585 329.05 2011-12-09 12:31:00 15804.0
581586 339.20 2011-12-09 12:49:00 13113.0
581587 249.45 2011-12-09 12:50:00 12680.0
这里使用的是函数,而不是带有聚合函数的列名称字典的每个组的第一个值