Python中基于字符串/整数序列的聚类和距离/相异矩阵

Python中基于字符串/整数序列的聚类和距离/相异矩阵,python,machine-learning,cluster-analysis,unsupervised-learning,distance-matrix,Python,Machine Learning,Cluster Analysis,Unsupervised Learning,Distance Matrix,我有客户在店逗留期间的数据。商店有4个区域;1、2、3和4区。现在每两分钟,我会根据他所在的区域,把他的读数记为10个数字。例: 1-1-1-1-1-1-1-1-3-3-2 4-4-3-3-3-3-3-2-1-3-3 3-4-1-2-2-3-1-4-2-1-4 基本上,我希望有一些客户主要位于某个特定区域,并且他们会相应地聚集在一起。因此,在第一个序列中,客户似乎更喜欢1区,下一个是3区,最后一个是like noise 我输入程序的只是一组序列(未标记)。如何生成一个距离/相异矩阵来计算Pyt

我有客户在店逗留期间的数据。商店有4个区域;1、2、3和4区。现在每两分钟,我会根据他所在的区域,把他的读数记为10个数字。例:

1-1-1-1-1-1-1-1-3-3-2
4-4-3-3-3-3-3-2-1-3-3
3-4-1-2-2-3-1-4-2-1-4
基本上,我希望有一些客户主要位于某个特定区域,并且他们会相应地聚集在一起。因此,在第一个序列中,客户似乎更喜欢1区,下一个是3区,最后一个是like noise


我输入程序的只是一组序列(未标记)。如何生成一个距离/相异矩阵来计算Python中每个序列之间的距离?

经过一点挖掘,我在Python中找到了textdistance库


尽管我的输入是一个整数序列,但对于这个问题它似乎工作得很好。

经过一点挖掘,我发现了python中的textdistance库


尽管我的输入是一个整数序列,但它似乎对这个问题很有效。

您可以使用余弦距离或欧几里德距离来计算距离

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.distance.cosine.html

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.euclidean_distances.html

可以使用余弦距离或欧几里德距离来计算距离

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.distance.cosine.html

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.euclidean_distances.html

你最后使用了哪种距离法?我有Ratcliff-Obershelp相似性,得到了相当好的结果。你最后使用了哪种距离法?我有Ratcliff-Obershelp相似性,得到了相当好的结果