Java 向clusterer添加新实例

Java 向clusterer添加新实例,java,machine-learning,cluster-analysis,weka,Java,Machine Learning,Cluster Analysis,Weka,我目前正在使用Weka的SimpleKMeans clusterer。 我想将新的看不见的实例集群到预先存在的集群或新集群中 如何将不可见的实例集群到集群中 我不确定我是否理解这个问题,但如果您正在寻找能够捕获比预定数量更多(或更少)的集群的方法,我建议您研究非参数聚类算法,例如Dirichlet Process Mixed。添加新实例的明显方法是使用原始“kmeans”出版物中的MacQueen k-means方法 我不认为Weka可以做到这一点,所以你必须自己编写代码。但这是最简单的 对不起

我目前正在使用Weka的SimpleKMeans clusterer。 我想将新的看不见的实例集群到预先存在的集群或新集群中


如何将不可见的实例集群到集群中

我不确定我是否理解这个问题,但如果您正在寻找能够捕获比预定数量更多(或更少)的集群的方法,我建议您研究非参数聚类算法,例如Dirichlet Process Mixed。

添加新实例的明显方法是使用原始“kmeans”出版物中的MacQueen k-means方法


我不认为Weka可以做到这一点,所以你必须自己编写代码。但这是最简单的

对不起,我不清楚。我使用数据集初始化集群以生成k个集群。在此之后,我想在每个新文档和每个集群之间执行余弦相似性。如果相似性低于阈值,那么创建一个集群,或者添加到一个预先存在的集群。是的,这听起来很像一个非参数集群问题。看看Dirichlet过程混合物,它应该是最容易遵循的。