Python 用于文本预测的重要性功能xgboost

Python 用于文本预测的重要性功能xgboost,python,nlp,text-mining,xgboost,Python,Nlp,Text Mining,Xgboost,我有两个文本文件,用于评估正面和负面。在使用nlp预处理数据后,我使用XGboost进行预测 我试图把重要性特征作为分类变量,但我得到了数字。如何将数字解释为分类变量 from xgboost import plot_importance plot_importance(classifierXG, max_num_features=10) pyplot.show() namesfxx中的xx应该是列号,当您从文本转换为索引时,您需要保存映射以便可以将其转换回。感谢您的重播,但是我如何保存映射

我有两个文本文件,用于评估正面和负面。在使用nlp预处理数据后,我使用XGboost进行预测 我试图把重要性特征作为分类变量,但我得到了数字。如何将数字解释为分类变量

from xgboost import plot_importance
plot_importance(classifierXG, max_num_features=10)
pyplot.show()


names
fxx
中的xx应该是列号,当您从文本转换为索引时,您需要保存映射以便可以将其转换回。感谢您的重播,但是我如何保存映射?您是如何将数据矢量化的?如果使用某种库,例如sklearn或keras,则该对象应具有映射字典/列表。#从sklearn.feature_extraction.text import CountVectorizer vectorizer=CountVectorizer(max_features=101,min_df=3,max_df=0.6,stop_words=stopwords.words('arabic'))创建弓模型X=vectorizer.fit_transform(语料库).toarray()矢量器.get_feature_names()#从sklearn.feature_extraction.text导入tfidf transformer=tfidf transformer()X=transformer.fit_transform(X).toarray()transformer.get_feature_names()签出两个对象
矢量器
转换器
,它们应该具有名为
词汇表
的属性,这是映射字典,您也可以根据需要如何使用它来反转它。