Machine learning BaggingClassifier每次获取所有数据集_Machine Learning_Scikit Learn_Classification_Svm_Python 3.5

Machine learning BaggingClassifier每次获取所有数据集

machine-learning scikit-learn

Machine learning BaggingClassifier每次获取所有数据集,machine-learning,scikit-learn,classification,svm,python-3.5,Machine Learning,Scikit Learn,Classification,Svm,Python 3.5,在这段代码中，我尝试用SVM应用BaggingClassifier。通常如sckitlearn文档中所述，max_samples确定每个估计器使用的最大样本数。然而，我注意到，每个估计器（n_估计器=5）都取所有数据集！！！这是一个bug吗？支持向量机。估计器\u samples\u0]将返回一个等于数据长度的数组。该数组由布尔值填充，那些等于True的值是估计器中使用的数据点（根据索引值）运行上面的代码我得到： from sklearn.ensemble import AdaBoostCla

在这段代码中，我尝试用SVM应用BaggingClassifier。通常如sckitlearn文档中所述，

max_samples

确定每个估计器使用的最大样本数。然而，我注意到，每个估计器（n_估计器=5）都取所有数据集！！！这是一个bug吗？

支持向量机。估计器\u samples\u0]将返回一个等于数据长度的数组。该数组由布尔值填充，那些等于

True

的值是估计器中使用的数据点（根据索引值）

运行上面的代码我得到：

from sklearn.ensemble import AdaBoostClassifier, BaggingClassifier, RandomForestClassifier
import numpy as np
import random
from sklearn.svm import SVC

X=np.random.rand(1000,2)
Y=[random.randint(0,1) for x in range(0,1000)]

svm=BaggingClassifier(SVC(kernel='rbf', random_state=123, gamma=.000001, C=100000, class_weight='balanced'), max_samples=1/5.0, n_estimators=5, n_jobs=-1,random_state=123)

classfier=svm.fit(X,Y)

print(len([i for i in svm.estimators_samples_[0] if i == True]))

from sklearn.ensemble import AdaBoostClassifier, BaggingClassifier, RandomForestClassifier
import numpy as np
import random
from sklearn.svm import SVC

X=np.random.rand(1000,2)
Y=[random.randint(0,1) for x in range(0,1000)]

svm=BaggingClassifier(SVC(kernel='rbf', random_state=123, gamma=.000001, C=100000, class_weight='balanced'), max_samples=1/5.0, n_estimators=5, n_jobs=-1,random_state=123)

classfier=svm.fit(X,Y)

print(len([i for i in svm.estimators_samples_[0] if i == True]))