Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/360.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/design-patterns/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 多维数据的TimeSeries K-means聚类_Python_Time Series_K Means - Fatal编程技术网

Python 多维数据的TimeSeries K-means聚类

Python 多维数据的TimeSeries K-means聚类,python,time-series,k-means,Python,Time Series,K Means,我正在使用Tslearn的TimeSeriesKmeans库将我的数据集与shape(3000300,8)进行聚类,但是文档中只讨论了数据集的维度为(n_样本,timesteps,1)即(单个特征)的情况。有人能帮我理解我是否能用更高的维度执行集群吗? 我使用“DTW”作为我的距离度量。我使用了tslearn.clustering库中的TimeSeriesKMeans。正如您所提到的,tslearn文档中唯一可用的示例是使用一维输入。然而,处理高维时间序列数据是非常常见的。例如,在我的例子中,我

我正在使用Tslearn的TimeSeriesKmeans库将我的数据集与shape(3000300,8)进行聚类,但是文档中只讨论了数据集的维度为(n_样本,timesteps,1)即(单个特征)的情况。有人能帮我理解我是否能用更高的维度执行集群吗?
我使用“DTW”作为我的距离度量。

我使用了tslearn.clustering库中的TimeSeriesKMeans。正如您所提到的,tslearn文档中唯一可用的示例是使用一维输入。然而,处理高维时间序列数据是非常常见的。例如,在我的例子中,我对人体运动进行聚类,每个帧包含30帧135个关节关键点。因此,我的数据形状就像(样本的数量、帧的数量、特征)

为了使用TSLearn的Timeserieskmeans,您需要输入一个包含(n_样本、m_时间步长(序列长度)、k_特征(k_维度))的数据数组

如果查看fit函数,函数参数如下所示:

拟合(X,y=None)[来源]计算k-均值聚类

参数:X:shape=(n_ts,sz,d)时间序列的类似数组 数据集

y忽略

关键是,您的输入数据应该是一个形状为(n_sample,seq_length,n_features)的数据数组,否则它将无法工作。例如,首先,我的数据类似于(n_样本)列表,该列表中的每个元素类似于(seq_长度,features)。直到我把它转换成一个带有(n_样本,seq_长度,特性)的数据数组,它才起作用