Machine learning 具有未知簇数的流式聚类_Machine Learning_Cluster Analysis_Spark Streaming_Apache Spark Mllib_Hierarchical Clustering

Machine learning 具有未知簇数的流式聚类

machine-learning

Machine learning 具有未知簇数的流式聚类,machine-learning,cluster-analysis,spark-streaming,apache-spark-mllib,hierarchical-clustering,Machine Learning,Cluster Analysis,Spark Streaming,Apache Spark Mllib,Hierarchical Clustering,我需要对一些及时到达的数据点进行分类。如果我只知道在我的数据点上可以找到多少不同的类（集群），流式K-Means就可以了。是否有任何方法可以使用Spark MLlib“开箱即用”来运行流式群集算法，其中存在未知数量的群集？当数据继续到达时，您是否需要试验并更改群集的数量？如果是这样，在什么时候可以“冻结”集群的数量？如果没有，您对集群密度和内聚性的算法有何指导？随着数据不断到达，您是否需要试验和更改集群的数量？如果是这样，在什么时候可以“冻结”集群的数量？如果没有，您对集群密度和内聚性的算法有何

我需要对一些及时到达的数据点进行分类。如果我只知道在我的数据点上可以找到多少不同的类（集群），流式K-Means就可以了。是否有任何方法可以使用Spark MLlib“开箱即用”来运行流式群集算法，其中存在未知数量的群集？

当数据继续到达时，您是否需要试验并更改群集的数量？如果是这样，在什么时候可以“冻结”集群的数量？如果没有，您对集群密度和内聚性的算法有何指导？随着数据不断到达，您是否需要试验和更改集群的数量？如果是这样，在什么时候可以“冻结”集群的数量？如果没有，您对集群密度和内聚性的算法有何指导？