Python 在循环内部或外部创建非常随机的树
我在X_样本中有许多样本矩阵(mxn)。 每个矩阵具有相同的行数(相同的m),但具有不同的特征数(不同的n)。 X样本中的矩阵示例为:1000x40、1000x35、1000x31000x25。 关于我的问题,我有以下(非常简化的)代码示例:Python 在循环内部或外部创建非常随机的树,python,scikit-learn,random-forest,Python,Scikit Learn,Random Forest,我在X_样本中有许多样本矩阵(mxn)。 每个矩阵具有相同的行数(相同的m),但具有不同的特征数(不同的n)。 X样本中的矩阵示例为:1000x40、1000x35、1000x31000x25。 关于我的问题,我有以下(非常简化的)代码示例: Y_train = Y_test = clf = ExtraTreesClassifier(n_estimators=500, max_depth=None,max_features="auto", m
Y_train =
Y_test =
clf = ExtraTreesClassifier(n_estimators=500, max_depth=None,max_features="auto",
min_samples_split=1, random_state=0)
for X_data in X_samples:
X_train = X_data[0]
X_test = X_data[1]
clf.fit(X_train,Y_train)
pred_res = clf.predict(X_test)
.....
我使用参数max\u features=“auto”
在循环外部创建一个分类器。
我使用具有不同数量特征的样本矩阵在循环中执行不同的分类。我的问题是,每次循环执行拟合操作时,分类器是否会根据X_序列的实际大小(特征的实际数量)调整max_特征的值。值为“auto”的参数max\u features
应获得等于特征数平方根的实际值。
也就是说,我应该在循环外部还是在循环内部创建分类器?是否有办法读取参数的实际值max\u features
?是。
fit
函数不会改变估计器。
请参阅。是。
fit
函数不会改变估计器。
请参阅。但是当\uuuu init\uuuu
参数设置为“auto”
时,外部树分类器
似乎不会导出实际的最大特征
。但是当\uu init\uuuuu
参数设置为“auto”
时,外部树分类器
似乎不会导出实际的最大特征。