Machine learning 从多个分类器计算分数

Machine learning 从多个分类器计算分数,machine-learning,classification,Machine Learning,Classification,我试图确定一个大型收藏中的成对物品之间的相似性。这些项目有几个属性,我能够为每个属性计算一个离散的相似性分数,介于0和1之间。我根据属性使用各种分类器:TF-IDF余弦相似性、朴素贝叶斯分类器等 当涉及到将所有这些信息编译成所有项目的最终相似性分数时,我陷入了困境。我不能只取一个未加权的平均值,因为1)什么是高分取决于分类器,2)有些分类器比其他分类器更重要。此外,一些分类器应仅考虑其高分,即高分表示更高的相似性,但低分没有意义 到目前为止,我已经通过猜测计算出了最终的分数,但是越来越多的分类器

我试图确定一个大型收藏中的成对物品之间的相似性。这些项目有几个属性,我能够为每个属性计算一个离散的相似性分数,介于0和1之间。我根据属性使用各种分类器:TF-IDF余弦相似性、朴素贝叶斯分类器等

当涉及到将所有这些信息编译成所有项目的最终相似性分数时,我陷入了困境。我不能只取一个未加权的平均值,因为1)什么是高分取决于分类器,2)有些分类器比其他分类器更重要。此外,一些分类器应仅考虑其高分,即高分表示更高的相似性,但低分没有意义

到目前为止,我已经通过猜测计算出了最终的分数,但是越来越多的分类器使得这是一个非常糟糕的解决方案。有什么方法可以确定一个最佳的公式,它可以计算我的各种分数并只返回一个?需要注意的是,系统确实会收到人类反馈,这就是一些分类器的工作原理


最终,我只对排名感兴趣,对于每个项目,最相似的项目。绝对分数本身是没有意义的,只是它们的顺序很重要

找一本关于集成分类的书。关于如何学习好的分类器组合,已经有很多工作要做。有很多选择。当然,您可以学习权重并进行加权平均。也可以使用纠错码。等等,pp


无论如何,请阅读“集成分类”,这是您需要的关键词。

有一本关于集成分类器主题的好书。该网站的网址为:

本书有两章(ch4和ch5)介绍标签输出的融合以及如何获得单个决策值

本章定义了一套方法,包括:

1加权多数票

2-朴素贝叶斯组合

3-


我希望这就是您想要的。

您可以添加另一个分类器,它将其他分类器的输出作为输入并返回单个值;)我明白这个想法,但不知道怎么做。你有没有一个例子或链接?你有没有特别推荐给机器学习新手的书?嗯,“Weka书”绝对适合机器学习,但我不知道它是否谈到集成。