Machine learning weka的ClusterMembership课程做什么?

Machine learning weka的ClusterMembership课程做什么?,machine-learning,classification,cluster-analysis,weka,categorization,Machine Learning,Classification,Cluster Analysis,Weka,Categorization,我在用weka做一些分类实验。我尝试了weka提供的一些可以应用于提取属性的功能,我发现将clustermembership应用于属性将提供比其他方法更高的准确性。我不太确定该功能的作用是什么,因为它删除了所有属性,只保留了诸如pCluster_0_0、pCluster_1_0、pCluster_2_0和class-attribute之类的内容。因此,我不太确定我从中得到的结果是否有效,以及它是否适用于其他未看到的新实例。来自Weka文档 使用基于密度的聚类器生成聚类成员值的过滤器;过滤实例由这

我在用weka做一些分类实验。我尝试了weka提供的一些可以应用于提取属性的功能,我发现将clustermembership应用于属性将提供比其他方法更高的准确性。我不太确定该功能的作用是什么,因为它删除了所有属性,只保留了诸如pCluster_0_0、pCluster_1_0、pCluster_2_0和class-attribute之类的内容。因此,我不太确定我从中得到的结果是否有效,以及它是否适用于其他未看到的新实例。来自Weka文档

使用基于密度的聚类器生成聚类成员值的过滤器;过滤实例由这些值加上class属性(如果在输入数据中设置)组成。如果设置了(标称)类属性,则会为每个类分别运行clusterer。在群集操作期间,将忽略类属性(如果已设置)和任何用户指定的属性


我真的很感激你能帮助我理解这一点

它基本上与您阅读的文档所描述的一样!它使用聚类算法获取每个输入实例(即实例所属的集群)的集群成员资格,并将其作为新实例输出。需要注意的是,所使用的聚类算法必须是基于密度的聚类器,例如DBSCAN或期望最大化


至于您的结果是否有效,您将需要针对clusterer运行一个测试集或进行百分比分割评估。你可能过度拟合了你的数据

它基本上与您阅读的文档所描述的一样!它使用聚类算法获取每个输入实例(即实例所属的集群)的集群成员资格,并将其作为新实例输出。需要注意的是,所使用的聚类算法必须是基于密度的聚类器,例如DBSCAN或期望最大化

至于您的结果是否有效,您将需要针对clusterer运行一个测试集或进行百分比分割评估。你可能过度拟合了你的数据