Python 用于文本预测的重要性功能xgboost_Python_Nlp_Text Mining_Xgboost

Python 用于文本预测的重要性功能xgboost

python nlp

Python 用于文本预测的重要性功能xgboost,python,nlp,text-mining,xgboost,Python,Nlp,Text Mining,Xgboost,我有两个文本文件，用于评估正面和负面。在使用nlp预处理数据后，我使用XGboost进行预测我试图把重要性特征作为分类变量，但我得到了数字。如何将数字解释为分类变量 from xgboost import plot_importance plot_importance(classifierXG, max_num_features=10) pyplot.show() namesfxx中的xx应该是列号，当您从文本转换为索引时，您需要保存映射以便可以将其转换回。感谢您的重播，但是我如何保存映射

我有两个文本文件，用于评估正面和负面。在使用nlp预处理数据后，我使用XGboost进行预测我试图把重要性特征作为分类变量，但我得到了数字。如何将数字解释为分类变量

from xgboost import plot_importance
plot_importance(classifierXG, max_num_features=10)
pyplot.show()

names

fxx

中的xx应该是列号，当您从文本转换为索引时，您需要保存映射以便可以将其转换回。感谢您的重播，但是我如何保存映射？您是如何将数据矢量化的？如果使用某种库，例如sklearn或keras，则该对象应具有映射字典/列表。#从sklearn.feature_extraction.text import CountVectorizer vectorizer=CountVectorizer（max_features=101，min_df=3，max_df=0.6，stop_words=stopwords.words（'arabic'））创建弓模型X=vectorizer.fit_transform（语料库）.toarray（）矢量器.get_feature_names（）#从sklearn.feature_extraction.text导入tfidf transformer=tfidf transformer（）X=transformer.fit_transform（X）.toarray（）transformer.get_feature_names（）签出两个对象

矢量器

和

转换器

，它们应该具有名为

词汇表

的属性，这是映射字典，您也可以根据需要如何使用它来反转它。