Machine learning 具有未知簇数的流式聚类

Machine learning 具有未知簇数的流式聚类,machine-learning,cluster-analysis,spark-streaming,apache-spark-mllib,hierarchical-clustering,Machine Learning,Cluster Analysis,Spark Streaming,Apache Spark Mllib,Hierarchical Clustering,我需要对一些及时到达的数据点进行分类。如果我只知道在我的数据点上可以找到多少不同的类(集群),流式K-Means就可以了。是否有任何方法可以使用Spark MLlib“开箱即用”来运行流式群集算法,其中存在未知数量的群集?当数据继续到达时,您是否需要试验并更改群集的数量?如果是这样,在什么时候可以“冻结”集群的数量?如果没有,您对集群密度和内聚性的算法有何指导?随着数据不断到达,您是否需要试验和更改集群的数量?如果是这样,在什么时候可以“冻结”集群的数量?如果没有,您对集群密度和内聚性的算法有何

我需要对一些及时到达的数据点进行分类。如果我只知道在我的数据点上可以找到多少不同的类(集群),流式K-Means就可以了。是否有任何方法可以使用Spark MLlib“开箱即用”来运行流式群集算法,其中存在未知数量的群集?

当数据继续到达时,您是否需要试验并更改群集的数量?如果是这样,在什么时候可以“冻结”集群的数量?如果没有,您对集群密度和内聚性的算法有何指导?随着数据不断到达,您是否需要试验和更改集群的数量?如果是这样,在什么时候可以“冻结”集群的数量?如果没有,您对集群密度和内聚性的算法有何指导?