Java 向clusterer添加新实例_Java_Machine Learning_Cluster Analysis_Weka

Java 向clusterer添加新实例

java machine-learning

Java 向clusterer添加新实例,java,machine-learning,cluster-analysis,weka,Java,Machine Learning,Cluster Analysis,Weka,我目前正在使用Weka的SimpleKMeans clusterer。我想将新的看不见的实例集群到预先存在的集群或新集群中如何将不可见的实例集群到集群中我不确定我是否理解这个问题，但如果您正在寻找能够捕获比预定数量更多（或更少）的集群的方法，我建议您研究非参数聚类算法，例如Dirichlet Process Mixed。添加新实例的明显方法是使用原始“kmeans”出版物中的MacQueen k-means方法我不认为Weka可以做到这一点，所以你必须自己编写代码。但这是最简单的对不起

我目前正在使用Weka的SimpleKMeans clusterer。我想将新的看不见的实例集群到预先存在的集群或新集群中

如何将不可见的实例集群到集群中

我不确定我是否理解这个问题，但如果您正在寻找能够捕获比预定数量更多（或更少）的集群的方法，我建议您研究非参数聚类算法，例如Dirichlet Process Mixed。

添加新实例的明显方法是使用原始“kmeans”出版物中的MacQueen k-means方法

我不认为Weka可以做到这一点，所以你必须自己编写代码。但这是最简单的

对不起，我不清楚。我使用数据集初始化集群以生成k个集群。在此之后，我想在每个新文档和每个集群之间执行余弦相似性。如果相似性低于阈值，那么创建一个集群，或者添加到一个预先存在的集群。是的，这听起来很像一个非参数集群问题。看看Dirichlet过程混合物，它应该是最容易遵循的。