Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/arduino/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scikit learn 多标签问题中的随机分类器-如何工作?_Scikit Learn_Classification_Random Forest - Fatal编程技术网

Scikit learn 多标签问题中的随机分类器-如何工作?

Scikit learn 多标签问题中的随机分类器-如何工作?,scikit-learn,classification,random-forest,Scikit Learn,Classification,Random Forest,sklearn的RandomForestClassifier如何处理多标签问题(引擎盖下) 例如,它是否在不同的单标签问题中阻止问题 为了清楚起见,我还没有真正测试它,但我在随机森林分类器的.fit()函数中看到了y:array-like,shape=[n_-samples]或[n_-samples,n_-outputs],当我开始使用树时,我有点困惑。如果您参考sklearn文档: 如果你深入研究预测概率的方法,你会发现: “预测的类别概率是同一类别的样本在一片叶子中的分数。” 所以在pre

sklearn的
RandomForestClassifier
如何处理多标签问题(引擎盖下)

例如,它是否在不同的单标签问题中阻止问题


为了清楚起见,我还没有真正测试它,但我在
随机森林分类器的
.fit()
函数中看到了
y:array-like,shape=[n_-samples]或[n_-samples,n_-outputs]
,当我开始使用树时,我有点困惑。如果您参考sklearn文档:

如果你深入研究预测概率的方法,你会发现: “预测的类别概率是同一类别的样本在一片叶子中的分数。”

所以在predict中,类是该节点上类的模式。如果使用加权类,这可能会发生变化

“类别权重:dict,dict列表,“平衡”或无,默认值=无 与{class_label:weight}形式的类关联的权重。如果未给出,则所有类都应具有权重1。”


希望这有帮助!:)

让我引用
scikit-learn
。委员会:

类似地,树的森林也扩展到(如果
Y
是一个大小为
[n\u个样本,n\u个输出]
)的数组)

决策树用户指南的内容如下:

…以支持多输出问题。这需要进行以下更改:

  • 在叶子中存储n个输出值,而不是1
  • 使用分割标准计算所有n个输出的平均减少量。
我希望这能回答你的问题。如果没有,您可以查看本节的参考:

  • M.Dumont等人,计算机视觉理论与应用国际会议,2009年

我很想知道它是如何工作的,我目前正在处理一个类似的问题。@Vishwas cool:)可能是重复的。Rf分类器不提供多标签问题谢谢你,阿方索,但是很好奇你是否有或者知道一些使用类\权重的例子。@Vishwas没有,对不起,我没有。我假设这是针对不平衡类的。但我从未使用过,我宁愿使用其他不平衡类方法,因为这个类的权重对我来说没有逻辑意义。如何处理分类器中的不平衡类?我需要对50种不同类型的缺陷进行分类,但是,缺陷类别并不平衡。在我的数据集中,有两三个类占主导地位,其他类的数量很少。