Scikit learn 随机森林回归器的特征选择

Scikit learn 随机森林回归器的特征选择,scikit-learn,regression,random-forest,feature-selection,Scikit Learn,Regression,Random Forest,Feature Selection,我试图从sklearn训练一个随机森林回归者。我想训练的功能有不同的类型,数字连续、数字分类、文本分类(姓名/国籍)、纬度和经度 我想知道的是,给定所有的特性,如何确定最有用的特性集来训练我的随机森林回归器?首先,在数据上运行随机森林模型 rf= RandomForestRegressor() rf.fit(train_data,train_labels) 然后使用特征重要性属性了解特征的重要性,从中可以过滤出特征 print(rf.feature_importances_) 然后再次在选定

我试图从sklearn训练一个随机森林回归者。我想训练的功能有不同的类型,数字连续、数字分类、文本分类(姓名/国籍)、纬度和经度


我想知道的是,给定所有的特性,如何确定最有用的特性集来训练我的随机森林回归器?

首先,在数据上运行随机森林模型

rf= RandomForestRegressor()
rf.fit(train_data,train_labels)
然后使用特征重要性属性了解特征的重要性,从中可以过滤出特征

print(rf.feature_importances_)
然后再次在选定的要素上运行模型

print(rf.feature_importances_)
您可以使用更多的技术,如相关性、pca等。拥有领域知识也可以在构建模型时为您提供优势。

应该是rf.fit(训练数据、训练标签),而不是测试数据。