Python 意外行为重采样时间序列

Python 意外行为重采样时间序列,python,pandas,Python,Pandas,我正在尝试对熊猫的蜱虫时间序列数据进行重采样 time 2014-07-01 10:00:00 1476.29 2014-07-01 10:00:01 1474.70 2014-07-01 10:00:02 1475.28 2014-07-01 10:00:02 1474.65 2014-07-01 10:00:04 1474.64 2014-07-01 10:00:05 1474.15 ... 我使用重采样 data["2014-07-01 10:00:2

我正在尝试对熊猫的蜱虫时间序列数据进行重采样

time
2014-07-01 10:00:00    1476.29
2014-07-01 10:00:01    1474.70
2014-07-01 10:00:02    1475.28
2014-07-01 10:00:02    1474.65
2014-07-01 10:00:04    1474.64
2014-07-01 10:00:05    1474.15
...
我使用重采样

data["2014-07-01 10:00:20":].resample("15s")
然后得到这样的结果:

time
2014-07-01 10:00:15    1472.711000
2014-07-01 10:00:30    1472.376000
2014-07-01 10:00:45    1471.965333
2014-07-01 10:01:00    1470.182667
2014-07-01 10:01:15    1469.607333
2014-07-01 10:01:30    1469.746429
...
我不明白为什么它从2014-07-01 10:00:15开始,而我从2014-07-01 10:00:20开始重新采样切片。这是一个特性还是一个bug?我怎样才能从需要的时间开始呢


所以我需要的是用给定数据中n秒前的标准偏差值计算新的时间序列。为了做到这一点,我决定从一定的时间开始把它分成几部分,然后把它们结合起来。也许有更好的办法?不想使用ItErrors。

10:00:20很明显在10:00:15到10:00:30的范围内,这就是10:00:15值所表示的。重新采样的timeseries的第一个bin是否应在10:00:20开始并在10:00:35结束?有许多参数,用于控制重采样。其中之一是基地。使用此选项,您可以执行“数据[2014-07-01 10:00:20:.重采样15s,基数=5.头”,这将输出2014-07-01 10:00:20作为第一个日期。但我不知道它是否有效,以及它如何影响重采样。也许看看这个参数,希望它能有所帮助。@Marcin谢谢,base有帮助,但不幸的是,我不知道在重新采样之前使用什么base,不同的频率第一个索引对我来说似乎是不可预测的。然而,我发现第一个索引并不取决于切片的长度,所以一个有点奇怪的解决方案是对小切片重新采样,检查第一个索引,获得所需的基数,然后对整个数据重新采样。