如何计算python中我的数据集中每年显示多少次
不知是否有人能帮我 我有一个列为“created_at”的数据集,其中有如下行如何计算python中我的数据集中每年显示多少次,python,python-3.x,pandas,Python,Python 3.x,Pandas,不知是否有人能帮我 我有一个列为“created_at”的数据集,其中有如下行 data = pd.read_csv("dataset.csv") col = data["created_at"] print(col.head()) print(col.tail()) 0 2014-06-01 21:03:16 1 2014-06-01 09:06:48 2 2014-06-01 00:31:52 3 2014-06-04 10:04:47 4 2014-06-0
data = pd.read_csv("dataset.csv")
col = data["created_at"]
print(col.head())
print(col.tail())
0 2014-06-01 21:03:16
1 2014-06-01 09:06:48
2 2014-06-01 00:31:52
3 2014-06-04 10:04:47
4 2014-06-04 10:05:40
Name: created_at, dtype: object
380064 2019-05-31 23:49:39
380065 2019-05-31 23:52:34
380066 2019-05-31 23:27:28
380067 2019-05-31 14:01:31
380068 2019-05-31 12:30:33
Name: created_at, dtype: object
我试图计算每年出现多少次,2014年和2015年出现多少次,以此类推
我尝试过计数器和for循环,但似乎无法让它工作。如果有人能提供帮助,我将不胜感激首先将您的列转换为
日期时间
类型,因为我看到它位于对象
类型中:
data['created_at'] = pd.to_datetime(data['created_at'])
现在使用dt
提取年份
部分:
data['year'] = data['created_at'].dt.year
最后,使用value\u counts
进行计数:
data.year.value_counts()
样本输出:
data.year.value_counts()
Out[142]:
2014 3
2015 2
Name: year, dtype: int64