R 选择具有设定时段的最早时间值的数据帧行
我在r中有一个df,有许多记录,格式如下,“到达时间”值为12小时 身份证件 到达时间 等待时间值 1. 2020-02-20 12:02:00 10 2. 2020-02-20 12:04:00 5. 99900 2020-02-20 23:47:00 8. 10000 2020-02-20 23:59:00 21 与一起使用,仅删除R 选择具有设定时段的最早时间值的数据帧行,r,pandas,po,R,Pandas,Po,我在r中有一个df,有许多记录,格式如下,“到达时间”值为12小时 身份证件 到达时间 等待时间值 1. 2020-02-20 12:02:00 10 2. 2020-02-20 12:04:00 5. 99900 2020-02-20 23:47:00 8. 10000 2020-02-20 23:59:00 21 与一起使用,仅删除NaNs并转换为DataFrame: df['arrival_time'] = pd.to_datetime(df['arrival_time']) df =
NaN
s并转换为DataFrame
:
df['arrival_time'] = pd.to_datetime(df['arrival_time'])
df = (df.resample('15Min', on='arrival_time')['wait_time_value']
.first()
.dropna()
.reset_index(name='wait_time_value'))
print (df)
arrival_time wait_time_value
0 2020-02-20 12:00:00 10.0
1 2020-02-20 23:45:00 8.0
使用
dplyr
:
df %>%
group_by(period_start) %>%
summarise(wait_time = min(wait_time_value))
这不是提供了最小等待时间值,而不是最早到达时间的值吗?我从你的问题中了解到这正是你想要的。您可以通过在
min
功能中用arrival\u time
替换wait\u time\u value
来获取最早到达时间。您是否可以提供易于复制的可复制格式的数据?了解