Pandas 基于数据帧的子集划分
我有一个日期列,它在转换为datetime后如下所示:Pandas 基于数据帧的子集划分,pandas,date,subset,Pandas,Date,Subset,我有一个日期列,它在转换为datetime后如下所示: data['date']=pd.to_datetime(data[date]) 2018-07-20 00:00:00 当我尝试使用此子集时: beg = datetime.datetime.strptime('2018-07-20', '%Y-%m-%d') end = datetime.datetime.strptime('2018-07-25', '%Y-%m-%d') data = data.loc[(data['dat
data['date']=pd.to_datetime(data[date])
2018-07-20 00:00:00
当我尝试使用此子集时:
beg = datetime.datetime.strptime('2018-07-20', '%Y-%m-%d')
end = datetime.datetime.strptime('2018-07-25', '%Y-%m-%d')
data = data.loc[(data['date']>=beg) & (data['date']<=end)]
beg=datetime.datetime.strtime('2018-07-20','%Y-%m-%d'))
end=datetime.datetime.strtime('2018-07-25','%Y-%m-%d')
data=data.loc[(data['date']>=beg)和(data['date']一种解决方案是将该日期移动到数据帧索引中
MCVE:
输出:
0
2010-05-16 3
2010-06-30 4
2010-08-14 5
2010-09-28 6
2010-11-12 7
2010-12-27 8
2011-02-10 9
2011-03-27 10
2011-05-11 11
2011-06-25 12
2011-08-09 13
2011-09-23 14
2011-11-07 15
2011-12-22 16
2012-02-05 17
2012-03-21 18
2012-05-05 19
2012-06-19 20
2012-08-03 21
2012-09-17 22
2012-11-01 23
2012-12-16 24
2013-01-30 25
2013-03-16 26
2013-04-30 27
2013-06-14 28
2013-07-29 29
2013-09-12 30
2013-10-27 31
你能把df.columns
打印到这个问题上吗这是一个非常大的数据集,所以df.columns会打印出很多变量名。“date”就在里面,不过这是值得的。我猜其中不止一个是date
,这就是为什么你应该看它的原因。啊,我明白了。我只检查一个“date”列啊,有趣的解决方案。我但是出于其他目的,我需要索引(我想我可以将当前索引转换为变量)。
0
2010-05-16 3
2010-06-30 4
2010-08-14 5
2010-09-28 6
2010-11-12 7
2010-12-27 8
2011-02-10 9
2011-03-27 10
2011-05-11 11
2011-06-25 12
2011-08-09 13
2011-09-23 14
2011-11-07 15
2011-12-22 16
2012-02-05 17
2012-03-21 18
2012-05-05 19
2012-06-19 20
2012-08-03 21
2012-09-17 22
2012-11-01 23
2012-12-16 24
2013-01-30 25
2013-03-16 26
2013-04-30 27
2013-06-14 28
2013-07-29 29
2013-09-12 30
2013-10-27 31