Machine learning 有什么算法擅长挑选特殊类别吗?

Machine learning 有什么算法擅长挑选特殊类别吗?,machine-learning,scikit-learn,Machine Learning,Scikit Learn,当我看到机器学习,特别是分类时,我发现一些算法被设计用于分类,例如,决策树,在不考虑下一步描述的情况下进行分类: 对于两个类别的问题,类别a和B,人们对一个特殊的问题感兴趣,例如类别a。对于这种情况,假设a有100个,B有1000个。一个好的分类可能会导致100A和100B混合作为一个部分,让900B作为另一个部分。这有利于分类。但是,是否有一种算法可以选择,例如,一个零件可以选择50A和5B,另一个零件可以选择50A和995B。这可能不如分类视图好,但如果有人对类别a感兴趣,我认为下一个算法可

当我看到机器学习,特别是分类时,我发现一些算法被设计用于分类,例如,决策树,在不考虑下一步描述的情况下进行分类:

对于两个类别的问题,类别a和B,人们对一个特殊的问题感兴趣,例如类别a。对于这种情况,假设a有100个,B有1000个。一个好的分类可能会导致100A和100B混合作为一个部分,让900B作为另一个部分。这有利于分类。但是,是否有一种算法可以选择,例如,一个零件可以选择50A和5B,另一个零件可以选择50A和995B。这可能不如分类视图好,但如果有人对类别a感兴趣,我认为下一个算法可以给出更纯的a结果,所以它更好

简言之,这意味着是否有一种算法可以对一个特殊的类别进行纯分类,而不是毫无偏见地对它们进行分类


如果scikit learn包含了这个算法,它会更好。

研究一个匹配算法,比如“稳定婚姻问题”


如果我理解正确,我认为你要求的是一种机器学习算法,它赋予某些类更高的权重,因此更可能按比例预测那些“特殊”类


如果这就是你要问的,你可以使用任何算法,在预测过程中输出每个类的概率。我认为大多数算法实际上都采用这种方法,但我知道神经网络确实如此。然后,您可以根据“特殊”类的比例更多数据对网络进行训练,或者手动后处理预测输出(每个类的概率数组),以使概率适应您的规范。

我连线了一些人反对它的原因?英语的原因还是这个问题太无聊了?这个问题是不可理解的,例如,决策树可以使用熵来分类数据,但是它不认为人们可能喜欢一个特殊的类别。也许有人只是想要一个好的算法来挑选这个类别。我明白了吗?嗨,谢谢你的回复。我认为“给予更高的权重”是混淆的。因为sampe_weight=sample_weight*class_weight(至少在scikit学习中是这样)。我想你们的办法是增加特殊样品的重量。如果这样做,您的列车数据可能比其他类别具有更特殊的类别数据比例。我不想改变不同类别中数据数量的比例。你可以尝试添加一个更具体的例子。很难理解你想要完成什么。在任何情况下,我都没有使用scikit learn的任何经验,因此我可能无法在特定于该工具的任何方面提供帮助。