Python 以熊猫为单位过滤时间序列数据帧,以给出每分钟的第一个数据点

Python 以熊猫为单位过滤时间序列数据帧,以给出每分钟的第一个数据点,python,pandas,Python,Pandas,我有高频外汇数据,每分钟有多个数据点。 对于我的分析,我很高兴每分钟有一个数据点 因此,我需要每分钟选取第一个数据点并保存它;并在同一分钟内丢弃其他数据点 我有一个样本数据集和所附图像中的预期结果 下面是创建数据集的代码 import pandas as pd date_time = ['20120201 170005600', '20120201 170035600', '20120201 170058600', '20120201 170105600', '20

我有高频外汇数据,每分钟有多个数据点。 对于我的分析,我很高兴每分钟有一个数据点

因此,我需要每分钟选取第一个数据点并保存它;并在同一分钟内丢弃其他数据点

我有一个样本数据集和所附图像中的预期结果

下面是创建数据集的代码

 import pandas as pd

date_time = ['20120201 170005600', '20120201 170035600', '20120201 170058600', '20120201 170105600',
             '20120201 170135600', '20120201 170158600', '20120201 170205600', '20120201 170235600',
             '20120201 170258600', '20120201 170305600', '20120201 170335600', '20120201 170358600', 
             '20120201 170405600', '20120201 170435600', '20120201 170458600']

bid = [1.306600, 1.306700, 1.306800, 1.306900, 1.307000, 1.307100, 1.307200, 1.307300, 
       1.307400,1.307500, 1.307600, 1.307700, 1.307800, 1.307900, 1.308000]
ask =[1.306770, 1.306870, 1.306970, 1.307070, 1.307170, 1.307270, 1.307370, 1.307470, 
      1.307570, 1.307670, 1.307770, 1.307870, 1.307970, 1.308070, 1.308170]


df = pd.DataFrame({'date_time':date_time, 'bid':bid, 'ask':ask})

创建
DatetimeIndex
by,可能的更改频率为:

或先与
一起使用

df1 = df.set_index('date_time').resample('T').first()

创建
DatetimeIndex
by,可能的更改频率为:

或先与
一起使用

df1 = df.set_index('date_time').resample('T').first()