Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/280.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何获得最小OOB误差的n_估计量和最大_特征,并将其用于优化?_Python_Optimization_Machine Learning_Scikit Learn_Random Forest - Fatal编程技术网

Python 如何获得最小OOB误差的n_估计量和最大_特征,并将其用于优化?

Python 如何获得最小OOB误差的n_估计量和最大_特征,并将其用于优化?,python,optimization,machine-learning,scikit-learn,random-forest,Python,Optimization,Machine Learning,Scikit Learn,Random Forest,我想优化一个随机森林分类器。因此,我绘制了一个OOB错误(代码在scikit中提供)。从这个图中,我想选取2个变量(n_估计量和max_特征),它们给出了最低的OOB误差。然后使用它们来优化分类器(clf.fit) 从曲线可以看出,使用170个n_估计量和5个max_特征,我得到了最低的OOB。但是如何将这两个值作为clf.fit发送到随机林?我想使用这种技术,而不是随机搜索或网格搜索 你知道从哪里开始吗 多谢各位。 在使用fit功能之前,必须初始化RF分类器。因此,您将使用您认为最好的参数初始

我想优化一个随机森林分类器。因此,我绘制了一个OOB错误(代码在scikit中提供)。从这个图中,我想选取2个变量(n_估计量和max_特征),它们给出了最低的OOB误差。然后使用它们来优化分类器(clf.fit)

从曲线可以看出,使用170个n_估计量和5个max_特征,我得到了最低的OOB。但是如何将这两个值作为clf.fit发送到随机林?我想使用这种技术,而不是随机搜索或网格搜索

你知道从哪里开始吗

多谢各位。

在使用fit功能之前,必须初始化RF分类器。因此,您将使用您认为最好的参数初始化RF,如文档中所述:clf=RandomForestClassifier(n_estimators=best_n,max_features=best_F)或最具体的参数:clf=RandomForestClassifier(n_estimators=170,max_features=5)。然后您使用拟合函数来训练分类器。@Nikolas Rieble Hi。我明白。但是,是否有任何“方法”、“参数”来获取这些信息并将其放入分类器中?因为我有很多数据集,我不想直观地确定n_估计量或max_特征。所以你的问题是:如何在五个数组中找到最小值的位置?这个问题可以进一步分解为a)如何找到数组的最小值?和b)如何查找数组中特定元素的索引?另一种解决方案是在创建这些数组时跟踪最小值,例如从无限最小值开始,然后替换,如果发现更好的参数集,则必须在使用拟合函数之前初始化RF分类器。因此,您将使用您认为最好的参数初始化RF,如文档中所述:clf=RandomForestClassifier(n_estimators=best_n,max_features=best_F)或最具体的参数:clf=RandomForestClassifier(n_estimators=170,max_features=5)。然后您使用拟合函数来训练分类器。@Nikolas Rieble Hi。我明白。但是,是否有任何“方法”、“参数”来获取这些信息并将其放入分类器中?因为我有很多数据集,我不想直观地确定n_估计量或max_特征。所以你的问题是:如何在五个数组中找到最小值的位置?这个问题可以进一步分解为a)如何找到数组的最小值?和b)如何查找数组中特定元素的索引?另一种解决方案是在创建这些数组时跟踪最小值,例如从无限最小值开始,然后在找到更好的参数集时替换