Python 随机进入抽样,以几分之一秒为限
我有时间戳标记的数据,每个固定时间段有非固定数量的条目。也就是说,有时我可以在一秒钟内有25个条目,而其他我可以在一秒钟内有100个条目(这是财务数据) 为了创建一个新的数据库,我想在定义的时间段内随机选取一个条目,比如前半秒和后半秒,以减小数据集的大小,并在条目内创建一致性。我如何在熊猫身上做到这一点Python 随机进入抽样,以几分之一秒为限,python,pandas,Python,Pandas,我有时间戳标记的数据,每个固定时间段有非固定数量的条目。也就是说,有时我可以在一秒钟内有25个条目,而其他我可以在一秒钟内有100个条目(这是财务数据) 为了创建一个新的数据库,我想在定义的时间段内随机选取一个条目,比如前半秒和后半秒,以减小数据集的大小,并在条目内创建一致性。我如何在熊猫身上做到这一点 非常感谢。可能不是最好的,但我认为它是有效的:将您的数据帧/序列按您想要的秒数进行重采样,然后从每个数据箱中随机选取一行(如果没有数据,则放入NaN): 输入: #df.head(10)
非常感谢。可能不是最好的,但我认为它是有效的:
将您的数据帧/序列按您想要的秒数进行重采样,然后从每个数据箱中随机选取一行(如果没有数据,则放入NaN
):
输入:
#df.head(10)
Values Values2
2020-01-01 09:00:00.100 0.190373 0.831841
2020-01-01 09:00:00.200 0.218069 0.586812
2020-01-01 09:00:00.500 0.611154 0.603198
2020-01-01 09:00:00.900 0.076038 0.061462
2020-01-01 09:00:00.900 0.519908 0.259880
2020-01-01 09:00:00.900 0.652016 0.925601
2020-01-01 09:00:01.000 0.256711 0.586374
2020-01-01 09:00:01.300 0.939387 0.409488
2020-01-01 09:00:01.400 0.075527 0.691568
2020-01-01 09:00:01.400 0.283443 0.490719
输出:
#output.head(3)
Values Values2
2020-01-01 09:00:00.000 0.190373 0.831841
2020-01-01 09:00:00.500 0.652016 0.925601
2020-01-01 09:00:01.000 0.256711 0.586374
#output.head(3)
Values Values2
2020-01-01 09:00:00.000 0.190373 0.831841
2020-01-01 09:00:00.500 0.652016 0.925601
2020-01-01 09:00:01.000 0.256711 0.586374