尝试获取随机林中的特征重要性(PySpark)

尝试获取随机林中的特征重要性(PySpark),pyspark,random-forest,feature-selection,Pyspark,Random Forest,Feature Selection,我的客户数据有近15k列。 我试图在数据上运行RF以减少列数,然后在其上运行其他ML算法 我能够在PySpark上运行RF,但无法提取变量的特征重要性 任何人有任何关于相同或任何其他技术的线索,可以帮助我将15k变量减少到200多个变量

我的客户数据有近15k列。 我试图在数据上运行RF以减少列数,然后在其上运行其他ML算法

我能够在PySpark上运行RF,但无法提取变量的特征重要性

任何人有任何关于相同或任何其他技术的线索,可以帮助我将15k变量减少到200多个变量