Python 在数据集第一个条目之前开始重新采样
亲爱的有经验的社区:, 我找不到解决我问题的优雅办法。 我有一个数据集的子样本,我想每周对其重新采样,但要在数据框中第一个条目的前几周开始(所以数为0的几周) 数据样本: 在: 输出: 最早的图像序列位于: 在: 输出: 我有另一个函数,它给出了在实验中测量的第一周的起点和最后一周的终点,它们是: 在: 输出: 我的问题是我想每周对df_pec重新采样,但从实验部署的第一周的第一天的第一秒钟开始。(使用s_startend作为参考) 我尝试:Python 在数据集第一个条目之前开始重新采样,python,python-3.x,pandas,resampling,Python,Python 3.x,Pandas,Resampling,亲爱的有经验的社区:, 我找不到解决我问题的优雅办法。 我有一个数据集的子样本,我想每周对其重新采样,但要在数据框中第一个条目的前几周开始(所以数为0的几周) 数据样本: 在: 输出: 最早的图像序列位于: 在: 输出: 我有另一个函数,它给出了在实验中测量的第一周的起点和最后一周的终点,它们是: 在: 输出: 我的问题是我想每周对df_pec重新采样,但从实验部署的第一周的第一天的第一秒钟开始。(使用s_startend作为参考) 我尝试: df_pec=df_pec.resample('1W
df_pec=df_pec.resample('1W', on='Image_Sequence_DateTime').sum()
print(df_pec.head(),'\n',df_pec.tail())
输出:
这很奇怪,因为它甚至跳过了df_pec中的第一天数据。(从2015-09-30 15:16:38开始)
即使成功了,我也无法指示重新采样以指定的值开始和结束(我的示例中的s_startend),即使在我的子样本df_pec的最早和最晚几周没有记录
我曾想过人为地在df_pec中添加两个条目,分别为real start和real end,但我认为这并不优雅,我不想在df中添加无意义的键
非常感谢你的智慧
Count Image_Sequence_DateTime
18 1 2015-11-06 03:22:19
21 1 2015-11-11 01:48:51
22 1 2015-11-11 07:30:47
37 1 2015-11-25 09:42:23
48 1 2015-12-05 12:12:34
df_pec.Image_Sequence_DateTime.min()
2015-09-30 15:16:38
print(s_startend)
Start 2015-09-28
End 2017-12-25
dtype: datetime64[ns]
df_pec=df_pec.resample('1W', on='Image_Sequence_DateTime').sum()
print(df_pec.head(),'\n',df_pec.tail())
Count
Image_Sequence_DateTime
2015-10-04 26.0
2015-10-11 92.0
2015-10-18 204.0
2015-10-25 193.0
2015-11-01 187.0
Count
Image_Sequence_DateTime
2017-11-19 20.0
2017-11-26 34.0
2017-12-03 16.0
2017-12-10 11.0
2017-12-17 3.0