Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/cmake/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 是否有一种可以使用权重进行聚类的算法?_R_Algorithm_Cluster Analysis - Fatal编程技术网

R 是否有一种可以使用权重进行聚类的算法?

R 是否有一种可以使用权重进行聚类的算法?,r,algorithm,cluster-analysis,R,Algorithm,Cluster Analysis,以上数据为流动人口数据的一部分。 “X”和“Y”表示纬度和经度,“Flow”表示流动人口的数量。 我们希望根据流量按权重对X和Y变量进行聚类,然后找到中心点。 这可能吗 我最初希望使用k-means创建多个集群。 我想知道Flow变量是否可以在不改变值的情况下影响两个变量的聚类​​关于X和Y,我想要一些中心点。 我缺乏解释,因为我是分析的初学者。请理解 大多数聚类算法都可以轻松加权 在k-均值中,使用加权平均值 在层次聚类中,您已经使用了权重,它们最初是1-只是设置不同而已 在DBSCAN中

以上数据为流动人口数据的一部分。 “X”和“Y”表示纬度和经度,“Flow”表示流动人口的数量。 我们希望根据流量按权重对X和Y变量进行聚类,然后找到中心点。 这可能吗

  • 我最初希望使用k-means创建多个集群。 我想知道Flow变量是否可以在不改变值的情况下影响两个变量的聚类​​关于X和Y,我想要一些中心点。 我缺乏解释,因为我是分析的初学者。请理解

大多数聚类算法都可以轻松加权

  • 在k-均值中,使用加权平均值
  • 在层次聚类中,您已经使用了权重,它们最初是1-只是设置不同而已
  • 在DBSCAN中,使用权重太阳代替计数来查找核心点
  • 更多

但是很少有库支持这一点,您需要编写自己的代码。

您首先需要决定如何对您的价值进行集群。您可以创建一个指定集群的新列。然后你可以很容易地计算出每个星团的重心或质心:@tom起初我想通过坐标找到中心点。但是现在我想通过加权坐标和流量变量来找到中心点。我能用你给我的解决方案解决这个问题吗?事实上我不太明白。所以你不需要再做聚类了,只需要一个加权坐标的中心?你是说
c(sum(X*Flow),sum(Y*Flow))/sum(Flow)
?我想你需要了解一下你想做什么样的聚类王。我建议您在本文档中理解地理聚类之间的差异,无论是否考虑点的值(权重)。
     X           Y      Flow
35.829875   128.550225  0.66
35.64903952 128.4373915 2.36
35.87826747 128.6094381 2.09
35.83962222 128.5711917 0.77
35.94296667 128.5503917 3.99
35.94184918 128.5629876 5.86
35.87022926 128.6917042 4.13
35.84118463 128.610549  16.61
35.84861677 128.6244008 0.04
35.86461772 128.595875  0