Python Scikit:如何选择MultinomalNB的alpha
我使用Python Scikit:如何选择MultinomalNB的alpha,python,machine-learning,scikit-learn,Python,Machine Learning,Scikit Learn,我使用Scikit编写了一个垃圾邮件过滤器。为此,我使用α=0.1的多项式nb。 有人能用外行的术语解释一下什么是alpha(平滑因子)以及我如何选择它的值吗 谢谢查看维基百科页面 基本上,我们的想法是希望减少稀有词的影响:例如,如果您有一封包含单词“多项式nb”的垃圾邮件,而没有包含该单词的非垃圾邮件,则无需添加平滑,您的垃圾邮件过滤器会将每封带有此关键字的电子邮件分类为垃圾邮件。那么我可以说,如果alpha=1会比alpha=0.1更有效地抑制稀有词的影响吗??
Scikit
编写了一个垃圾邮件过滤器。为此,我使用α=0.1的多项式nb。
有人能用外行的术语解释一下什么是alpha(平滑因子)以及我如何选择它的值吗
谢谢查看维基百科页面
基本上,我们的想法是希望减少稀有词的影响:例如,如果您有一封包含单词“多项式nb”的垃圾邮件,而没有包含该单词的非垃圾邮件,则无需添加平滑,您的垃圾邮件过滤器会将每封带有此关键字的电子邮件分类为垃圾邮件。那么我可以说,如果alpha=1会比alpha=0.1更有效地抑制稀有词的影响吗??