Machine learning Weka中分类前的聚类

Machine learning Weka中分类前的聚类,machine-learning,classification,cluster-analysis,weka,svm,Machine Learning,Classification,Cluster Analysis,Weka,Svm,我的数据集中的实例有多个数值属性和一个二进制类。在Weka中,有没有一种方法可以使用聚类器并将结果传递给分类器(比如SMO)以改进分类结果?可以将聚类信息添加到数据中的一种方法是使用以下方法(在Weka Explorer中): 加载您喜爱的数据集 选择您的集群模型(在我的例子中,我使用SimpleKMeans) 根据需要修改群集器的参数 使用群集模式的培训集 开始集群过程 生成集群后,右键单击结果列表并选择“可视化集群分配” 选择Y作为集群,然后点击保存按钮,如下所示: 将数据保存到指定位置

我的数据集中的实例有多个数值属性和一个二进制类。在Weka中,有没有一种方法可以使用聚类器并将结果传递给分类器(比如SMO)以改进分类结果?

可以将聚类信息添加到数据中的一种方法是使用以下方法(在Weka Explorer中):

  • 加载您喜爱的数据集
  • 选择您的集群模型(在我的例子中,我使用SimpleKMeans)
  • 根据需要修改群集器的参数
  • 使用群集模式的培训集
  • 开始集群过程
  • 生成集群后,右键单击结果列表并选择“可视化集群分配”
  • 选择Y作为集群,然后点击保存按钮,如下所示:
  • 将数据保存到指定位置
  • 然后,您应该能够加载该文件,并像其他属性一样在分类器中使用集群信息。只要确保该类设置为正确的属性,您就可以开始了

    注意:当我运行这些测试时,我使用J48来评估类,而J48似乎只使用集群的值来评估类。模型的准确性也出人意料地高,所以要么数据集太简单,要么我可能在聚类过程中遗漏了一步


    希望这有帮助

    在Weka Explorer中,加载数据集后

    • 选择“预处理”选项卡
    • 单击“选择…”按钮
    • 添加无监督属性过滤器“AddCluster”
    • 单击按钮旁边的,打开Clusterer选择字段,选择一个Clusterer
    • 配置/参数化集群器
    • 关闭所有模式对话框
    单击“应用”按钮应用过滤器。它将添加另一个名为“集群”的属性,作为属性列表中最右边的属性


    然后继续进行分类实验。

    AddCluster筛选器的选项变灰,无法应用。原因是什么?我不知道,这取决于你的数据。也许可以尝试使用不同的数据集,例如使用Weka附带的一个内置数据集?只是为了确保它能正常工作。不幸的是,我必须处理这个数据集。无论如何,谢谢你的回答。