用pandas分析数据集
我是数据科学领域的初学者。我试图对数据进行一些聚合,但不确定如何对其进行编码。 我有下面的数据框。我需要了解如何计算驱动程序完成的作业总数(驱动程序ID是唯一的) 如何调整,使我可以看到如下输出用pandas分析数据集,pandas,Pandas,我是数据科学领域的初学者。我试图对数据进行一些聚合,但不确定如何对其进行编码。 我有下面的数据框。我需要了解如何计算驱动程序完成的作业总数(驱动程序ID是唯一的) 如何调整,使我可以看到如下输出 Diver_ID - Total_Jobs 53028 - 45 53051 - 20 sumNo\u作业和groupbydriver id应执行此任务 data.groupby('Driver_Id')['No_of_jobs'].sum() 另一个选项是pivot\u table
Diver_ID - Total_Jobs
53028 - 45
53051 - 20
sum
No\u作业和groupby
driver id应执行此任务
data.groupby('Driver_Id')['No_of_jobs'].sum()
另一个选项是pivot\u table
和aggfunc=['count']
:
df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])
嗨,我正在审阅你的帖子。当您展示自己的努力时,SO社区非常重视,因此您可能需要添加一些代码。请在此查看如何提出好的问题:不是一个与scikit学习相关的问题-我正在将标题和标签更改为
pandas
-请确认您确实在使用pandas…是的,这是一个与pandas相关的操作。谢谢你的建议。@desertnautwould不是df.groupby('Driver\u Id')['No\u of\u Jobs'].sum()
?
df.pivot_table(values=['No_of_jobs'],index='Driver_Id',aggfunc=['count'])