Python 重新索引透视表以添加缺少的天数和时间
我尝试使用数据透视表将活动日志制作成热图。要添加缺少的时间和日期,我使用reindex函数,但无法按列重新编制索引Python 重新索引透视表以添加缺少的天数和时间,python,pandas,pivot-table,heatmap,reindex,Python,Pandas,Pivot Table,Heatmap,Reindex,我尝试使用数据透视表将活动日志制作成热图。要添加缺少的时间和日期,我使用reindex函数,但无法按列重新编制索引 import pandas as pd import matplotlib.pyplot as plt df = pd.DataFrame({'Date':['2015-11-10 18:39:00','2015-11-14 11:30:00','2015-11-14 13:48:00','2015-11-15 16:06:00', '2015-11-16 21:08:0
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame({'Date':['2015-11-10 18:39:00','2015-11-14 11:30:00','2015-11-14 13:48:00','2015-11-15 16:06:00',
'2015-11-16 21:08:00','2020-08-31 18:06:00','2020-09-18 11:17:00','2020-09-19 15:41:00',
'2020-09-25 16:28:00','2020-09-25 19:45:00']})
df['Date'] = pd.to_datetime(df['Date'])
hm = df.pivot_table(columns=df['Date'].dt.hour, index=df['Date'].dt.day_name(), aggfunc='count', fill_value=0, dropna=False)
hm = hm.reindex(['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'], axis='index')
hm = hm.reindex(range(0,24), axis='columns', fill_value=0)
figg, ax2 = plt.subplots(figsize=(20,3))
im = ax2.imshow(hm)
我收到以下错误消息
ValueError: Buffer dtype mismatch, expected 'Python object' but got 'long'
预期输出应为
0 1 2 3 4 5 6 7 8 9 20 21 22 23
Monday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0
Tuesday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0
Wednesday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0
Thursday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0
Friday 0 0 0 0 0 0 0 0 0 0 ... 0 0 1 0
Saturday 0 0 0 0 0 0 0 0 0 0 ... 0 1 0 0
Sunday 0 0 0 0 0 0 0 0 0 0 ... 0 0 1 0
欢迎来到StackOverflow 这里的索引是一个多索引,第一级是“日期”。Pandas认为您试图更改索引的这一部分,但这部分不起作用,因为它是一个字符串。(我想,我对此不确定。) 如果您使用删除索引的第一级,您将有一个常规整数索引,它将正常工作。我在结果中也使用了NaNs,因此我还添加了一个fillna()调用
hm=df.pivot\u表(列=df['Date'].dt.hour,索引=df['Date'].dt.day\u name(),aggfunc='count',fill\u值=0,dropna=False)
hm=hm.reindex([‘星期一’、‘星期二’、‘星期三’、‘星期四’、‘星期五’、‘星期六’、‘星期日’],axis='index')
hm.columns=hm.columns.droplevel(0)
hm=hm.reindex(范围(0,24),轴=列,填充值=0)
hm=hm.fillna(0)
结果我得到了下面的情节
您得到的输出是一个多索引列索引(第一级是“日期”,第二级是小时)。发生这种情况的原因是,您没有为对
pivot\u表的调用提供values
参数
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame({'Date':['2015-11-10 18:39:00','2015-11-14 11:30:00','2015-11-14 13:48:00','2015-11-15 16:06:00',
'2015-11-16 21:08:00','2020-08-31 18:06:00','2020-09-18 11:17:00','2020-09-19 15:41:00',
'2020-09-25 16:28:00','2020-09-25 19:45:00']})
df['Date'] = pd.to_datetime(df['Date'])
# Note the addition of the `values` argument
hm = df.pivot_table(columns=df['Date'].dt.hour, index=df['Date'].dt.day_name(), values="Date", aggfunc='count', fill_value=0, dropna=False)
# you can also reindex both the index and columns in 1 call
hm = hm.reindex(
index=['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday'],
columns=range(24),
fill_value=0
)
print(hm)
Date 0 1 2 3 4 5 6 7 8 9 ... 14 15 16 17 18 19 20 21 22 23
Date ...
Monday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 1 0 0 1 0 0
Tuesday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 1 0 0 0 0 0
Wednesday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
Thursday 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
Friday 0 0 0 0 0 0 0 0 0 0 ... 0 0 1 0 0 1 0 0 0 0
Saturday 0 0 0 0 0 0 0 0 0 0 ... 0 1 0 0 0 0 0 0 0 0
Sunday 0 0 0 0 0 0 0 0 0 0 ... 0 0 1 0 0 0 0 0 0 0
请根据示例输入分享您的预期输出。