Scikit learn 多标签问题中的随机分类器-如何工作？_Scikit Learn_Classification_Random Forest

Scikit learn 多标签问题中的随机分类器-如何工作？

scikit-learn

Scikit learn 多标签问题中的随机分类器-如何工作？,scikit-learn,classification,random-forest,Scikit Learn,Classification,Random Forest,sklearn的RandomForestClassifier如何处理多标签问题（引擎盖下）例如，它是否在不同的单标签问题中阻止问题为了清楚起见，我还没有真正测试它，但我在随机森林分类器的.fit（）函数中看到了y:array-like，shape=[n_-samples]或[n_-samples，n_-outputs]，当我开始使用树时，我有点困惑。如果您参考sklearn文档：如果你深入研究预测概率的方法，你会发现： “预测的类别概率是同一类别的样本在一片叶子中的分数。” 所以在pre

sklearn的

RandomForestClassifier

如何处理多标签问题（引擎盖下）

例如，它是否在不同的单标签问题中阻止问题

为了清楚起见，我还没有真正测试它，但我在

随机森林分类器的.fit（）
函数中看到了y:array-like，shape=[n_-samples]或[n_-samples，n_-outputs]
，当我开始使用树时，我有点困惑。如果您参考sklearn文档：

如果你深入研究预测概率的方法，你会发现：
“预测的类别概率是同一类别的样本在一片叶子中的分数。”
所以在predict中，类是该节点上类的模式。如果使用加权类，这可能会发生变化
“类别权重：dict，dict列表，“平衡”或无，默认值=无
与{class_label:weight}形式的类关联的权重。如果未给出，则所有类都应具有权重1。”
希望这有帮助！：）
 让我引用scikit-learn
。委员会：
类似地，树的森林也扩展到（如果Y
是一个大小为[n\u个样本，n\u个输出]
）的数组）
决策树用户指南的内容如下：
…以支持多输出问题。这需要进行以下更改：

在叶子中存储n个输出值，而不是1
使用分割标准计算所有n个输出的平均减少量。

我希望这能回答你的问题。如果没有，您可以查看本节的参考：

M.Dumont等人，计算机视觉理论与应用国际会议，2009年
我很想知道它是如何工作的，我目前正在处理一个类似的问题。@Vishwas cool:）可能是重复的。Rf分类器不提供多标签问题谢谢你，阿方索，但是很好奇你是否有或者知道一些使用类\权重的例子。@Vishwas没有，对不起，我没有。我假设这是针对不平衡类的。但我从未使用过，我宁愿使用其他不平衡类方法，因为这个类的权重对我来说没有逻辑意义。如何处理分类器中的不平衡类？我需要对50种不同类型的缺陷进行分类，但是，缺陷类别并不平衡。在我的数据集中，有两三个类占主导地位，其他类的数量很少。