为R中的时间序列创建距离矩阵
我有一个大约400个双变量时间序列的数据集,每个都包含大约80000个观测值。在手动查看它们之后,很明显有些非常相似,因此我想使用DTW动态时间扭曲对它们进行集群 现在,如果我尝试使用DTW方法为整个集合创建距离矩阵,R告诉我它需要50GB的RAM,而我没有。是否可以使用for循环或类似方法分别计算两个时间序列之间的距离为R中的时间序列创建距离矩阵,r,matrix,time-series,distance,R,Matrix,Time Series,Distance,我有一个大约400个双变量时间序列的数据集,每个都包含大约80000个观测值。在手动查看它们之后,很明显有些非常相似,因此我想使用DTW动态时间扭曲对它们进行集群 现在,如果我尝试使用DTW方法为整个集合创建距离矩阵,R告诉我它需要50GB的RAM,而我没有。是否可以使用for循环或类似方法分别计算两个时间序列之间的距离 对于时间序列的聚类,您会推荐哪些其他距离方法?如果您天真地使用DTW,它是二次的,并且您的矩阵将有6400000000个元素,因此为50gig 但是,如果您只需要距离而不需要路
对于时间序列的聚类,您会推荐哪些其他距离方法?如果您天真地使用DTW,它是二次的,并且您的矩阵将有6400000000个元素,因此为50gig 但是,如果您只需要距离而不需要路径,那么您可以一次只使用两列、160000个元素(不到1兆字节)来执行DTW 不过还是有一些坏消息,空间复杂度不是问题,但时间复杂度会让你丧命 然而,也有一些技巧,比如下采样[a]可能会有所帮助 如果您需要更多帮助,请给我的最后一位作者发电子邮件 [a]