Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/design-patterns/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何以分钟为单位对时间序列数据集进行采样_R_Data.table - Fatal编程技术网

R 如何以分钟为单位对时间序列数据集进行采样

R 如何以分钟为单位对时间序列数据集进行采样,r,data.table,R,Data.table,我有以30秒为间隔记录的时间序列传感器数据,如下所示: 负责人: 这是一个非常大的数据集,有超过20亿条记录。我需要每隔5分钟对数据进行采样以减小数据集的大小。我们可以尝试使用%%。由于初始数据集是data.table,我们可以使用data.table方法来提高效率 DT[!time %% 300] df[df$time%%300==0,]选择我要做的间隔300中的全部DT[seq(min(time)、max(time)、by=300L)、on=“time”]这样就可以清楚地知道数据中是否缺少

我有以30秒为间隔记录的时间序列传感器数据,如下所示:

负责人:


这是一个非常大的数据集,有超过20亿条记录。我需要每隔5分钟对数据进行采样以减小数据集的大小。

我们可以尝试使用
%%
。由于初始数据集是
data.table
,我们可以使用
data.table
方法来提高效率

DT[!time %% 300]

df[df$time%%300==0,]
选择我要做的间隔300中的全部
DT[seq(min(time)、max(time)、by=300L)、on=“time”]
这样就可以清楚地知道数据中是否缺少任何间隔。请不要从注释中复制粘贴答案,只需进行极小的更改。可能令人困惑的是,在data.table中使用名称
df
DT[!time %% 300]