Nlp 如何区分xgboost或随机林中重要特征的方向?

Nlp 如何区分xgboost或随机林中重要特征的方向?,nlp,random-forest,xgboost,sentiment-analysis,text-classification,Nlp,Random Forest,Xgboost,Sentiment Analysis,Text Classification,我现在正在研究二进制文本分类问题(比如情感分析),仅仅通过feature\u importances\u 假设这个分类问题有两个标签1和0。那么有没有办法打印出特征的方向(正片还是负片)?比如说,单词特征A有一个扩展或高tfidf,标签为1 当然,我可以拉出这个特定单词特征的tfidf列,并用pearson系数与标签关联,系数的+/-表示方向,对吗?对于这个或xgboost和random forest,任何其他更优雅的方法都内置了这样的函数。(我没有找到) 谢谢这并不是你想要的,但我通常都是这样

我现在正在研究二进制文本分类问题(比如情感分析),仅仅通过
feature\u importances\u

假设这个分类问题有两个标签1和0。那么有没有办法打印出特征的方向(正片还是负片)?比如说,单词特征A有一个扩展或高tfidf,标签为1

当然,我可以拉出这个特定单词特征的tfidf列,并用pearson系数与标签关联,系数的+/-表示方向,对吗?对于这个或xgboost和random forest,任何其他更优雅的方法都内置了这样的函数。(我没有找到)


谢谢

这并不是你想要的,但我通常都是这样做的。我喜欢它的工作方式,即使我切换型号

这并不完全是你想要的,但我通常都会这样做。我喜欢它的工作方式,即使我切换型号

除了Lame(Sam H建议的),这里也是一个选项。

除了Lame(Sam H建议的),这里也是一个选项。

谢谢,实际上我已经阅读了TreeInterpreter和Lame,并且生成的功能重要性列表似乎是针对“每个测试”的。虽然我的目的是给出一个总体列表,所以我可以简单地总结每个测试的重要性权重?ThxThanks实际上我已经阅读了TreeInterpreter和Lime,似乎生成的特性重要性列表是针对“每个测试”的。虽然我的目的是给出一个总体列表,所以我可以简单地总结每个测试的重要性权重?谢谢