R 是否有一种可以使用权重进行聚类的算法?
以上数据为流动人口数据的一部分。 “X”和“Y”表示纬度和经度,“Flow”表示流动人口的数量。 我们希望根据流量按权重对X和Y变量进行聚类,然后找到中心点。 这可能吗R 是否有一种可以使用权重进行聚类的算法?,r,algorithm,cluster-analysis,R,Algorithm,Cluster Analysis,以上数据为流动人口数据的一部分。 “X”和“Y”表示纬度和经度,“Flow”表示流动人口的数量。 我们希望根据流量按权重对X和Y变量进行聚类,然后找到中心点。 这可能吗 我最初希望使用k-means创建多个集群。 我想知道Flow变量是否可以在不改变值的情况下影响两个变量的聚类关于X和Y,我想要一些中心点。 我缺乏解释,因为我是分析的初学者。请理解 大多数聚类算法都可以轻松加权 在k-均值中,使用加权平均值 在层次聚类中,您已经使用了权重,它们最初是1-只是设置不同而已 在DBSCAN中
- 我最初希望使用k-means创建多个集群。 我想知道Flow变量是否可以在不改变值的情况下影响两个变量的聚类关于X和Y,我想要一些中心点。 我缺乏解释,因为我是分析的初学者。请理解
- 在k-均值中,使用加权平均值
- 在层次聚类中,您已经使用了权重,它们最初是1-只是设置不同而已
- 在DBSCAN中,使用权重太阳代替计数来查找核心点
- 更多
但是很少有库支持这一点,您需要编写自己的代码。您首先需要决定如何对您的价值进行集群。您可以创建一个指定集群的新列。然后你可以很容易地计算出每个星团的重心或质心:@tom起初我想通过坐标找到中心点。但是现在我想通过加权坐标和流量变量来找到中心点。我能用你给我的解决方案解决这个问题吗?事实上我不太明白。所以你不需要再做聚类了,只需要一个加权坐标的中心?你是说
c(sum(X*Flow),sum(Y*Flow))/sum(Flow)
?我想你需要了解一下你想做什么样的聚类王。我建议您在本文档中理解地理聚类之间的差异,无论是否考虑点的值(权重)。
X Y Flow
35.829875 128.550225 0.66
35.64903952 128.4373915 2.36
35.87826747 128.6094381 2.09
35.83962222 128.5711917 0.77
35.94296667 128.5503917 3.99
35.94184918 128.5629876 5.86
35.87022926 128.6917042 4.13
35.84118463 128.610549 16.61
35.84861677 128.6244008 0.04
35.86461772 128.595875 0