如何对多个维度进行javascript在线k-means聚类
我发现了许多javascript在线k-means集群的例子,但所有的例子都是针对二维的 如果我有56个维度(例如),如何进行聚类 奖金问题:如何对多个维度进行javascript在线k-means聚类,javascript,cluster-analysis,k-means,Javascript,Cluster Analysis,K Means,我发现了许多javascript在线k-means集群的例子,但所有的例子都是针对二维的 如果我有56个维度(例如),如何进行聚类 奖金问题: 有了一些新数据,是否有可能预测聚类中的某些值(比如,76%属于聚类x,因此值应该是y)k-means算法应该很容易移植到任意数量的维度。看起来是这样的: 随机选择簇的中心 对于每个点检查,最近的簇是什么 通过计算所有点的平均值来计算新的群集中心 重复此操作,直到群集中心不变 在2d中,检查2中(x1,x2)和(y1,y2)之间的距离。像这样(x1-x2)
有了一些新数据,是否有可能预测聚类中的某些值(比如,76%属于聚类x,因此值应该是y)k-means算法应该很容易移植到任意数量的维度。看起来是这样的:
(x1,x2)
和(y1,y2)
之间的距离。像这样(x1-x2)^2+(y1-y2)^2
(如果仅使用距离将其与另一个距离进行比较,则不需要使用平方根)。在56个维度中,只有56个组件
在2d中,通过获取所有点的平均值来计算簇中心。取所有点的第一个维度并取平均值avg1
,取所有第二个维度avg2
到56,您的新群集中心将(avg1、avg2、avg3…avg56)
不容易的是它非常昂贵。查看像PCA这样的降维(特征提取)算法
还要确保所有频率都已标准化。例如,它们的范围在(-100100)
之间
如果您需要更多信息,请访问机器学习课程。
第8周是关于集群及其陷阱。56个数值?这是一个例子。我没有数过。它可能只有34个变量。主要的部分是,这些值是否是数字;以有意义的方式(即可比较的方式)。由于预处理等原因,大多数人无法从这些数据中获得有用的结果。