Python 如何在熊猫的日期列中添加年份
我试图在pandas数据框中的日期列中添加一年,但是当我使用Python 如何在熊猫的日期列中添加年份,python,pandas,datetime,Python,Pandas,Datetime,我试图在pandas数据框中的日期列中添加一年,但是当我使用pd.to_timedelta时,我会得到额外的小时和分钟。我知道我可以把更新的时间缩短,但我觉得一定有办法精确地增加一年。我的尝试如下: import pandas as pd dates = pd.DataFrame({'date':['20170101','20170102','20170103']}) dates['date'] = pd.to_datetime(dates['date'], format='%Y%m%d') d
pd.to_timedelta
时,我会得到额外的小时和分钟。我知道我可以把更新的时间缩短,但我觉得一定有办法精确地增加一年。我的尝试如下:
import pandas as pd
dates = pd.DataFrame({'date':['20170101','20170102','20170103']})
dates['date'] = pd.to_datetime(dates['date'], format='%Y%m%d')
dates['date2'] = dates['date'] + pd.to_timedelta(1, unit='y')
dates
收益率:
Out[1]:
date date2
0 2017-01-01 2018-01-01 05:49:12
1 2017-01-02 2018-01-02 05:49:12
2 2017-01-03 2018-01-03 05:49:12
如果不添加05:49:12 HH:mm:ss,我如何添加一年?编辑:如果您不关心闰年等问题,则此方法有效。否则,请参阅jp_数据分析的答案 您可以使用365和
unit='d'
:
pd.to_timedelta(365, unit='d')
您可以通过以下方式进行正常化:
闰年检查:
In [100]: pd.to_datetime(['2011-02-28', '2012-02-29']) + pd.offsets.DateOffset(years=1)
Out[100]: DatetimeIndex(['2012-02-28', '2013-02-28'], dtype='datetime64[ns]', freq=None)
或者将
datetime
转换为date
dates['date'] = dates['date'].apply(lambda a: a.date())
您可以使用
dataframe[“column”].dt.component格式的代码访问日期(年、月和日)的组件
例如,月组件是dataframe[“column”].dt.month
,年组件是dataframe[“column”].dt.year
,不幸的是,我有大量的日期,需要考虑闰年。我想保留日历日期以考虑假期(元旦、圣诞节等)明白了。那么,jp_data_分析的答案应该是有效的(而且应该是快速的)。
In [100]: pd.to_datetime(['2011-02-28', '2012-02-29']) + pd.offsets.DateOffset(years=1)
Out[100]: DatetimeIndex(['2012-02-28', '2013-02-28'], dtype='datetime64[ns]', freq=None)
dates['date'] = dates['date'].apply(lambda a: a.date())