R 如何以分钟为单位对时间序列数据集进行采样
我有以30秒为间隔记录的时间序列传感器数据,如下所示: 负责人:R 如何以分钟为单位对时间序列数据集进行采样,r,data.table,R,Data.table,我有以30秒为间隔记录的时间序列传感器数据,如下所示: 负责人: 这是一个非常大的数据集,有超过20亿条记录。我需要每隔5分钟对数据进行采样以减小数据集的大小。我们可以尝试使用%%。由于初始数据集是data.table,我们可以使用data.table方法来提高效率 DT[!time %% 300] df[df$time%%300==0,]选择我要做的间隔300中的全部DT[seq(min(time)、max(time)、by=300L)、on=“time”]这样就可以清楚地知道数据中是否缺少
这是一个非常大的数据集,有超过20亿条记录。我需要每隔5分钟对数据进行采样以减小数据集的大小。我们可以尝试使用
%%
。由于初始数据集是data.table
,我们可以使用data.table
方法来提高效率
DT[!time %% 300]
df[df$time%%300==0,]
选择我要做的间隔300中的全部DT[seq(min(time)、max(time)、by=300L)、on=“time”]
这样就可以清楚地知道数据中是否缺少任何间隔。请不要从注释中复制粘贴答案,只需进行极小的更改。可能令人困惑的是,在data.table中使用名称df
。
DT[!time %% 300]