Python 意外行为重采样时间序列_Python_Pandas

Python 意外行为重采样时间序列

python pandas

Python 意外行为重采样时间序列,python,pandas,Python,Pandas,我正在尝试对熊猫的蜱虫时间序列数据进行重采样 time 2014-07-01 10:00:00 1476.29 2014-07-01 10:00:01 1474.70 2014-07-01 10:00:02 1475.28 2014-07-01 10:00:02 1474.65 2014-07-01 10:00:04 1474.64 2014-07-01 10:00:05 1474.15 ... 我使用重采样 data["2014-07-01 10:00:2

我正在尝试对熊猫的蜱虫时间序列数据进行重采样

time
2014-07-01 10:00:00    1476.29
2014-07-01 10:00:01    1474.70
2014-07-01 10:00:02    1475.28
2014-07-01 10:00:02    1474.65
2014-07-01 10:00:04    1474.64
2014-07-01 10:00:05    1474.15
...

我使用重采样

data["2014-07-01 10:00:20":].resample("15s")

然后得到这样的结果：

time
2014-07-01 10:00:15    1472.711000
2014-07-01 10:00:30    1472.376000
2014-07-01 10:00:45    1471.965333
2014-07-01 10:01:00    1470.182667
2014-07-01 10:01:15    1469.607333
2014-07-01 10:01:30    1469.746429
...

我不明白为什么它从2014-07-01 10:00:15开始，而我从2014-07-01 10:00:20开始重新采样切片。这是一个特性还是一个bug？我怎样才能从需要的时间开始呢

所以我需要的是用给定数据中n秒前的标准偏差值计算新的时间序列。为了做到这一点，我决定从一定的时间开始把它分成几部分，然后把它们结合起来。也许有更好的办法？不想使用ItErrors。

10:00:20很明显在10:00:15到10:00:30的范围内，这就是10:00:15值所表示的。重新采样的timeseries的第一个bin是否应在10:00:20开始并在10:00:35结束？有许多参数，用于控制重采样。其中之一是基地。使用此选项，您可以执行“数据[2014-07-01 10:00:20:.重采样15s，基数=5.头”，这将输出2014-07-01 10:00:20作为第一个日期。但我不知道它是否有效，以及它如何影响重采样。也许看看这个参数，希望它能有所帮助。@Marcin谢谢，base有帮助，但不幸的是，我不知道在重新采样之前使用什么base，不同的频率第一个索引对我来说似乎是不可预测的。然而，我发现第一个索引并不取决于切片的长度，所以一个有点奇怪的解决方案是对小切片重新采样，检查第一个索引，获得所需的基数，然后对整个数据重新采样。