Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/sql-server/21.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 2.7 Python-带朴素贝叶斯的SelectFromModel_Python 2.7_Machine Learning_Scikit Learn_Naivebayes - Fatal编程技术网

Python 2.7 Python-带朴素贝叶斯的SelectFromModel

Python 2.7 Python-带朴素贝叶斯的SelectFromModel,python-2.7,machine-learning,scikit-learn,naivebayes,Python 2.7,Machine Learning,Scikit Learn,Naivebayes,在文本分类任务中,我将与用于特征选择的组合使用 SelectFromModel(estimator=MultinomialNB(alpha=1.0)) SelectFromModel通过计算确定要素的重要性: importances = np.linalg.norm(estimator.coef_, axis=0,ord=norm_order) 但这不正是我想要的相反吗,因为频率高的特性会导致绝对值低吗 已经有多个问题得到了很好的回答,用于确定给定特定类别的功能的重要性,但一般来说不用于功能

在文本分类任务中,我将与用于特征选择的组合使用

SelectFromModel(estimator=MultinomialNB(alpha=1.0))
SelectFromModel通过计算确定要素的重要性:

importances = np.linalg.norm(estimator.coef_, axis=0,ord=norm_order)
但这不正是我想要的相反吗,因为频率高的特性会导致绝对值低吗

已经有多个问题得到了很好的回答,用于确定给定特定类别的功能的重要性,但一般来说不用于功能的重要性


是否有一种方法可以通过SelectFromModel结合NB来确定特征重要性,或者其他方法更适合此任务?

有一种称为交叉验证递归特征消除的功能,也称为。它试图根据特征的重要性对特征进行递归排序,并在指定估计器的情况下进行交叉验证,以获得最佳数量的特征。有关更多信息,请参阅


我不知道为什么selectFromModel不能与NaiveBayes一起工作。如果我发现任何与此相关的内容,我将更新此答案。同时,您可以检查RFECV是否符合您的需要。

有一个称为交叉验证递归特征消除的函数,也称为。它试图根据特征的重要性对特征进行递归排序,并在指定估计器的情况下进行交叉验证,以获得最佳数量的特征。有关更多信息,请参阅


我不知道为什么selectFromModel不能与NaiveBayes一起工作。如果我发现任何与此相关的内容,我将更新此答案。同时,您可以检查RFECV是否适合您的需要。

请详细说明。你所说的“高频特征”是什么意思?此外,这是一项分类任务,因此很明显,特征重要性将根据类别而定。你能详细解释一下你想要什么吗?我指的是具有高术语频率的功能(在文档中),例如使用CountVectorizer。SelectFromModel基本上决定了分类任务中每个特征的重要性,并选择了“最重要的特征”,这些特征应该适用于SVC等精细分类器,但正如我试图解释的,它似乎不适用于NB。请详细说明一下。你所说的“高频特征”是什么意思?此外,这是一项分类任务,因此很明显,特征重要性将根据类别而定。你能详细解释一下你想要什么吗?我指的是具有高术语频率的功能(在文档中),例如使用CountVectorizer。SelectFromModel基本上决定了分类任务中每个特征的重要性,并选择了“最重要的特征”,这些特征应该可以很好地用于SVC之类的分类器,但正如我试图解释的,它似乎不适用于NB。