Python 以熊猫为单位过滤时间序列数据帧，以给出每分钟的第一个数据点_Python_Pandas

Python 以熊猫为单位过滤时间序列数据帧，以给出每分钟的第一个数据点

python pandas

Python 以熊猫为单位过滤时间序列数据帧，以给出每分钟的第一个数据点,python,pandas,Python,Pandas,我有高频外汇数据，每分钟有多个数据点。对于我的分析，我很高兴每分钟有一个数据点因此，我需要每分钟选取第一个数据点并保存它；并在同一分钟内丢弃其他数据点我有一个样本数据集和所附图像中的预期结果下面是创建数据集的代码 import pandas as pd date_time = ['20120201 170005600', '20120201 170035600', '20120201 170058600', '20120201 170105600', '20

我有高频外汇数据，每分钟有多个数据点。对于我的分析，我很高兴每分钟有一个数据点

因此，我需要每分钟选取第一个数据点并保存它；并在同一分钟内丢弃其他数据点

我有一个样本数据集和所附图像中的预期结果

下面是创建数据集的代码

 import pandas as pd

date_time = ['20120201 170005600', '20120201 170035600', '20120201 170058600', '20120201 170105600',
             '20120201 170135600', '20120201 170158600', '20120201 170205600', '20120201 170235600',
             '20120201 170258600', '20120201 170305600', '20120201 170335600', '20120201 170358600', 
             '20120201 170405600', '20120201 170435600', '20120201 170458600']

bid = [1.306600, 1.306700, 1.306800, 1.306900, 1.307000, 1.307100, 1.307200, 1.307300, 
       1.307400,1.307500, 1.307600, 1.307700, 1.307800, 1.307900, 1.308000]
ask =[1.306770, 1.306870, 1.306970, 1.307070, 1.307170, 1.307270, 1.307370, 1.307470, 
      1.307570, 1.307670, 1.307770, 1.307870, 1.307970, 1.308070, 1.308170]


df = pd.DataFrame({'date_time':date_time, 'bid':bid, 'ask':ask})

创建

DatetimeIndex

by，可能的更改频率为：

或先与

一起使用

：

df1 = df.set_index('date_time').resample('T').first()

创建

DatetimeIndex

by，可能的更改频率为：

或先与

一起使用

：

df1 = df.set_index('date_time').resample('T').first()