用pandas分析数据集_Pandas - Fatal编程技术网

用pandas分析数据集

pandas

用pandas分析数据集,pandas,Pandas,我是数据科学领域的初学者。我试图对数据进行一些聚合，但不确定如何对其进行编码。我有下面的数据框。我需要了解如何计算驱动程序完成的作业总数（驱动程序ID是唯一的）如何调整，使我可以看到如下输出 Diver_ID - Total_Jobs 53028 - 45 53051 - 20 sumNo\u作业和groupbydriver id应执行此任务 data.groupby('Driver_Id')['No_of_jobs'].sum() 另一个选项是pivot\u table

我是数据科学领域的初学者。我试图对数据进行一些聚合，但不确定如何对其进行编码。我有下面的数据框。我需要了解如何计算驱动程序完成的作业总数（驱动程序ID是唯一的）

如何调整，使我可以看到如下输出

Diver_ID -  Total_Jobs

53028  - 45

53051  - 20

sum

No\u作业和

groupby

driver id应执行此任务

data.groupby('Driver_Id')['No_of_jobs'].sum()

另一个选项是

pivot\u table

和

aggfunc=['count']

：

df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])

嗨，我正在审阅你的帖子。当您展示自己的努力时，SO社区非常重视，因此您可能需要添加一些代码。请在此查看如何提出好的问题：不是一个与scikit学习相关的问题-我正在将标题和标签更改为

pandas

-请确认您确实在使用pandas…是的，这是一个与pandas相关的操作。谢谢你的建议。@desertnautwould不是

df.groupby（'Driver\u Id'）['No\u of\u Jobs'].sum（）

？

df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])