Python 使用一列datetime对象将两级索引(索引?)设置为datetime.date()和datetime.time()
我有一个数据帧,它有一列“timestamp”,它由Python 使用一列datetime对象将两级索引(索引?)设置为datetime.date()和datetime.time(),python,pandas,datetime,indexing,Python,Pandas,Datetime,Indexing,我有一个数据帧,它有一列“timestamp”,它由datetime对象(YYYY-mm-dd-HH:mm:SS)组成。我想从这些时间戳中提取日期(datetime.date()),并将其设置为0级索引,将时间(datetime.time())设置为1级索引 例如: timestamp value1 value2 index 0 2018-01-01 09:00:00 10 20 1
datetime
对象(YYYY-mm-dd-HH:mm:SS)组成。我想从这些时间戳中提取日期(datetime.date()
),并将其设置为0级索引,将时间(datetime.time()
)设置为1级索引
例如:
timestamp value1 value2
index
0 2018-01-01 09:00:00 10 20
1 2018-01-01 09:01:00 11 21
2 2018-01-02 09:00:00 12 22
3 2018-01-02 09:01:00 13 23
将成为:
value1 value2
date time
2018-01-01 09:00:00 10 20
09:01:00 11 21
2018-01-02 09:00:00 12 22
09:01:00 13 23
选项1
使用
drop
和set\u索引
df.set_index([df.timestamp.dt.date, df.timestamp.dt.time]).drop('timestamp', 1)
value1 value2
timestamp timestamp
2018-01-01 09:00:00 10 20
09:01:00 11 21
2018-01-02 09:00:00 12 22
09:01:00 13 23
选项2
d = df.set_index('timestamp')
d.index = [d.index.date, d.index.time]
d
value1 value2
2018-01-01 09:00:00 10 20
09:01:00 11 21
2018-01-02 09:00:00 12 22
09:01:00 13 23
与最后一个原始列一起使用:
mux = pd.MultiIndex.from_arrays([df['timestamp'].dt.date, df['timestamp'].dt.time],
names=('date','time'))
df = df.set_index(mux).drop('timestamp', 1)
或加上:
df = (df.set_index([df['timestamp'].dt.date, df['timestamp'].dt.time])
.drop('timestamp', 1)
.rename_axis(('date','time')))
print (df)
value1 value2
date time
2018-01-01 09:00:00 10 20
09:01:00 11 21
2018-01-02 09:00:00 12 22
09:01:00 13 23