Python 多维数据的TimeSeries K-means聚类
我正在使用Tslearn的TimeSeriesKmeans库将我的数据集与shape(3000300,8)进行聚类,但是文档中只讨论了数据集的维度为(n_样本,timesteps,1)即(单个特征)的情况。有人能帮我理解我是否能用更高的维度执行集群吗?Python 多维数据的TimeSeries K-means聚类,python,time-series,k-means,Python,Time Series,K Means,我正在使用Tslearn的TimeSeriesKmeans库将我的数据集与shape(3000300,8)进行聚类,但是文档中只讨论了数据集的维度为(n_样本,timesteps,1)即(单个特征)的情况。有人能帮我理解我是否能用更高的维度执行集群吗? 我使用“DTW”作为我的距离度量。我使用了tslearn.clustering库中的TimeSeriesKMeans。正如您所提到的,tslearn文档中唯一可用的示例是使用一维输入。然而,处理高维时间序列数据是非常常见的。例如,在我的例子中,我
我使用“DTW”作为我的距离度量。我使用了tslearn.clustering库中的TimeSeriesKMeans。正如您所提到的,tslearn文档中唯一可用的示例是使用一维输入。然而,处理高维时间序列数据是非常常见的。例如,在我的例子中,我对人体运动进行聚类,每个帧包含30帧135个关节关键点。因此,我的数据形状就像(样本的数量、帧的数量、特征) 为了使用TSLearn的Timeserieskmeans,您需要输入一个包含(n_样本、m_时间步长(序列长度)、k_特征(k_维度))的数据数组 如果查看fit函数,函数参数如下所示: 拟合(X,y=None)[来源]计算k-均值聚类 参数:X:shape=(n_ts,sz,d)时间序列的类似数组 数据集 y忽略 关键是,您的输入数据应该是一个形状为(n_sample,seq_length,n_features)的数据数组,否则它将无法工作。例如,首先,我的数据类似于(n_样本)列表,该列表中的每个元素类似于(seq_长度,features)。直到我把它转换成一个带有(n_样本,seq_长度,特性)的数据数组,它才起作用