如何对多个维度进行javascript在线k-means聚类

如何对多个维度进行javascript在线k-means聚类,javascript,cluster-analysis,k-means,Javascript,Cluster Analysis,K Means,我发现了许多javascript在线k-means集群的例子,但所有的例子都是针对二维的 如果我有56个维度(例如),如何进行聚类 奖金问题: 有了一些新数据,是否有可能预测聚类中的某些值(比如,76%属于聚类x,因此值应该是y)k-means算法应该很容易移植到任意数量的维度。看起来是这样的: 随机选择簇的中心 对于每个点检查,最近的簇是什么 通过计算所有点的平均值来计算新的群集中心 重复此操作,直到群集中心不变 在2d中,检查2中(x1,x2)和(y1,y2)之间的距离。像这样(x1-x2)

我发现了许多javascript在线k-means集群的例子,但所有的例子都是针对二维的

如果我有56个维度(例如),如何进行聚类

奖金问题:


有了一些新数据,是否有可能预测聚类中的某些值(比如,76%属于聚类x,因此值应该是y)

k-means算法应该很容易移植到任意数量的维度。看起来是这样的:

  • 随机选择簇的中心
  • 对于每个点检查,最近的簇是什么
  • 通过计算所有点的平均值来计算新的群集中心
  • 重复此操作,直到群集中心不变
  • 在2d中,检查2中
    (x1,x2)
    (y1,y2)
    之间的距离。像这样
    (x1-x2)^2+(y1-y2)^2
    (如果仅使用距离将其与另一个距离进行比较,则不需要使用平方根)。在56个维度中,只有56个组件

    在2d中,通过获取所有点的平均值来计算簇中心。取所有点的第一个维度并取平均值
    avg1
    ,取所有第二个维度
    avg2
    到56,您的新群集中心将
    (avg1、avg2、avg3…avg56)

    不容易的是它非常昂贵。查看像PCA这样的降维(特征提取)算法

    还要确保所有频率都已标准化。例如,它们的范围在
    (-100100)
    之间

    如果您需要更多信息,请访问机器学习课程。
    第8周是关于集群及其陷阱。

    56个数值?这是一个例子。我没有数过。它可能只有34个变量。主要的部分是,这些值是否是数字;以有意义的方式(即可比较的方式)。由于预处理等原因,大多数人无法从这些数据中获得有用的结果。